Hãy tin vào wikipedia... màu trắng!
Các nhà nghiên cứu từ phòng thí nghiệm Wiki thuộc trường đại học California, Santa Cruz vừa thiết kế ra một hệ thống giúp người sử dụng phân biệt được thông tin nào Wikipedia cung cấp có thể tin cậy được, thông tin nào thì không.
Dải màu càng nhạt, thông tin càng đáng tin
Wikipedia vừa cho ra mắt công cụ WikiTrust
giúp độc giả của trang bách khoa toàn thư mở này có thêm cơ sở để tin
tưởng vào nội dung những bài viết của trang web bản tiếng Anh. Thanh
công cụ này sẽ tô màu lên tất cả những từ trong các bài viết dựa trên
độ tin cậy của thông tin mà tác giả cung cấp và thời gian thông tin đó
tồn tại trên trang web.
Trung bình mỗi tháng có hơn 60 triệu lần
truy cập vào Wikipedia để tìm kiếm tài liệu trong kho dữ liệu với hơn
12 triệu bài viết được thể hiện dưới 260 ngôn ngữ khác nhau.
Mặc
dù trang web này được rất nhiều người sử dụng nhưng vẫn có một lượng
lớn độc giả cho rằng những thông tin mà trang web cung cấp là không
đáng tin cậy.
Lý do họ đưa ra là nội dung các bài viết trên
Wikipedia do các độc giả tự nguyện đóng góp, bất cứ ai kết nối Internet
cũng có thể cung cấp thông tin cho Wikipedia. Vì vậy, những bài viết
trong trang web này có xu hướng lộn xộn, những thông tin có thể không
chính xác hay sai lệch hoàn toàn để phục vụ ý đồ cá nhân của những
người giấu tên.
WikiTrust đánh dấu màu sắc lên nội dung thông
tin mới được đưa vào các bài viết trong trang web. Biện pháp này căn cứ
vào mức độ kinh nghiệm của tác giả bài viết từ việc xác định thời gian
tồn tại của những thông tin trước đây mà tác giả đó cung cấp cho trang
này. Quy luật rất đơn giản: Thông tin tồn tại càng lâu trên các bài
viết trên Wikipedia thì độ tin cậy của thông tin càng cao.
|
Màu màu da cam đậm: Những bài viết được lấy từ những nguồn có nghi vấn, chưa xác định được độ chính xác
Màu cam nhạt: Những bài viết lấy từ những nguồn thông tin đáng tin cậy hơn
Màu trắng: Những bài viết thông tin tin cậy (căn cứ là càng có nhiều lượt người truy cập, bổ sung, sửa đổi thông tin trong bài viết đó)
|
Tuy
không tham gia vào dự án lần này của Wikipedia, Chuyên gia phát triển
phần mềm Wikipedia, nhà khoa học nghiên cứu các nơ ron thần kinh,
Virgil Griffith của Viện nghiên cứu công nghệ California cho rằng: "Dự
án này được áp dụng quy luật tự nhiên của Darwin. Mọi người đều có
quyền thêm thông tin vào những bài viết của Wikipedia. Nội dung những
bài viết sẽ xuất hiện nhiều thông tin không chính xác nhưng những thông
tin không chính xác đó sẽ không tồn tại được lâu mà theo thời gian nó
sẽ bị loại bỏ.”
Chương trình WikiTrust được thực hiện do sự
mở rộng của MediaWiki từ tháng 11 năm ngoái. Bất cứ ai sử dụng trang
web của Wiki đều có thể tải miễn phí chương trình này và thêm tính năng
sử dụng dải màu để phân biệt độ tin cậy của thông tin.
Những
nhân vật cấp cao điều hành WikiMedia Foundation, một tổ chức phi lợi
nhuận điều hành Wikipedia, đã đưa ra quyết định thêm đặc tính
WikiTrust. Tất cả những thành viên đã đăng ký sử dụng Wikipedia đều có
thể sử dụng công cụ màu sắc để phân biệt độ chính xác của thông tin
bằng cách kích chuột vào thanh công cụ Trust info (thông tin tin cậy). Như vậy là họ đã có thể dễ dàng sử dụng dải màu của Wikipedia.
 |
|
Sử dụng dải màu để phân loại độ tin cậy của thông tin liệu có khả thi?
Nguồn: wired.com
|
Dùng công cụ thông minh thay vì sức người
Luca de Alfaro, nhà khoa học máy tính làm việc cho phòng thí nghiệm UCSC Wiki, người phụ trách dự án WikiTrust cho biết: “Việc
dựa vào các cộng tác viên điện tử để xây dựng nội dung cho trang web
ngày càng trở nên phổ biến hơn trên toàn thế giới. Ngày càng có nhiều
dịch vụ không thể tồn tại được mà không dựa vào kinh nghiệm của chính
người sử dụng dịch vụ và sự tin tưởng của người sử dụng vào nội dung
thông tin của dịch vụ đó đưa ra.”
De Alfaro nảy ra ý tưởng
sử dụng kinh nghiệm của những thành viên đóng góp bài viết cho
Wikipedia để phân loại thông tin khi chính trang web của ông bị một
lượng lớn các thông tin “rác” đổ vào. “Tôi bắt đầu suy nghĩ xem có
cách nào khuyến khích mọi người xây dựng nội dung thông tin cho trang
web theo cách có hiệu quả hơn không?”.
Các trang web như
Amazon.com, eBay sử dụng các thông tin do các cộng tác viên cung cấp,
các cộng tác viên đánh giá chất lượng của nội dung thông tin đã trở nên
nổi tiếng. Có rất nhiều người cho rằng Wikipedia nên áp dụng phương
pháp này nhưng De Alfaro lại lo rằng nếu Wikipedia cho phép người sử
dụng đánh giá chất lượng các bài viết trên Wikipedia sẽ gây ảnh hưởng
tới môi trường cộng tác giữa người sử dụng và trang web.
Ông cũng không muốn những người biên tập nội dung trang web phải bận rộn hơn. Ông Alfaro phát biểu: “Nếu
có trang web nào hoạt động tốt như Wikipedia thì sẽ rất khó cho người
biên tập khi họ phải đưa ra đề xuất sửa đổi lời bình luận của mọi người
khi xem xét bài viết của một người”.
Từ khi trang web đưa ra
quyết định xem xét lại thông tin trong những bài viết của Wikipedia thì
ông Alfaro nhận thấy là ông có thể sử dụng chính nguồn dữ liệu để tạo
nên độ tin cậy của trang web. Biện pháp này hoàn toàn độc lập với những
thông tin mà con người đưa vào.
Ông nói: “Máy móc có thể
làm việc thay thế con người nên bạn có thể lấy được thông tin mà bạn
cần mà không cần sử dụng đến nguồn nhân lực. Mục đích của bạn được thực
hiện chỉ thông qua một công cụ thông minh thì điều đó sẽ tốt hơn nhiều.”
Chấm điểm kinh nghiệm cho thành viên
Phòng
thí nghiệm Wiki đưa ra công cụ giúp xác định độ tin cậy của thông tin
do mục tiêu của bách khoa toàn thư mở muốn nâng cao độ chính xác của
nội dung các bài viết Wiki cung cấp. Hoặc ít nhất phòng thí nghiệm này
phát minh ra công cụ nhằm thực hiện đồng bộ với mục tiêu trang web đề
ra.
Bo Adler, một sinh viên tốt nghiệp UCSC, cùng cộng tác với De Alfaro trong việc phát triển WikiTrust cho rằng: “Độc
giả có thể đo sự chính xác của thông tin mà tác giả bài viết đó đưa ra
bằng cách xem xét thời gian tồn tại của thông tin bài viết trên trang
web.”
Adler bổ sung thêm: “Khi độc giả thêm bất cứ thông
tin nào vào Wikipedia mà thông tin đó tồn tại một thời gian dài thì
điều đó có đồng nghĩa là độ chính xác của thông tin đó cao. Còn nếu như
độc giả nào thêm thông tin vào bài viết mà thông tin đó bị xóa đi ngay
lập tức thì nó cũng đồng nghĩa rằng thông tin đó không đáng tin cậy”.
Dựa theo những đóng góp trước đây cho trang web mà WikiTrust
sẽ chấm điểm kinh nghiệm cho thành viên đó từ 0-9. Khi một người có
đóng góp thông tin cho Wikipedia thì dải màu trên thông tin đó sẽ
chuyển màu cam dựa vào số điểm kinh nghiệm của người đó: Nếu dải màu đó
có màu cam càng đậm thì độ tin cậy của thông tin đó càng ít. Sau đó các
tác giả khác sẽ sửa đổi thông tin có trong bài viết đó, và các độc giả
sẽ cho điểm bài viết mới được sửa đổi đó.
Nếu
như các độc giả đồng ý với nội dung bài viết thì nội dung đó sẽ được
giữ nguyên, còn nếu không nội dung cả bài viết đó sẽ quay lại lúc chưa
được sửa đổi. Dải màu trên bài viết đó sẽ nhạt dần theo thời gian nó
tồn tại. Đó cũng đồng nghĩa với việc có nhiều tác giả đồng ý với nội
dung bài viết đó.
Các
nhà nghiên cứu quyết định không hiện mức độ kinh nghiệm của tác giả của
các bài viết. Họ mong muốn bằng cách này sẽ khuyến khích các tác giả
mới tham gia đóng góp bài viết cho bách khoa toàn thư mở. Ông De Alfaro
nói: “Kể cả tác giả của bài viết có là một nhà sinh vật học lỗi lạc
đi chăng nữa mà họ chưa có nhiều bài viết đóng góp cho Wikipedia thì
bậc kinh nghiệm của họ do trang web xếp hạng vẫn thấp.”
Adler cũng cho hay: “Chúng
tôi cố gắng phán đoán khi nào thì thông tin đó bị xóa. Chúng tôi muốn
những thông tin bị xóa là những thông tin có độ tin cậy thấp và những
thông tin không bị xóa là những thông tin có độ tin cậy cao.’’
Theo nhà khoa học máy tính Ed Chi của Trung tâm nghiên cứu Palo Alto, trung tâm phụ trách nghiên cứu Wikipedia và sự chứng nhận của xã hội, “Wikipedia không phải là một trang web có thiết kế và quy trình vận hành một cách thông thường.” Nếu WikiTrust
muốn thực hiện chức năng chấm điểm tất cả các từ trong tất cả các bài
viết thì sẽ tiêu tốn lượng năng lượng đáng kể và nó cần thêm vài
Terabyte vào bộ nhớ phụ.
Nhưng những nhà nghiên cứu phòng thí
nghiệm Wiki khẳng định, họ đã làm việc và tìm ra biện pháp giúp
WikiTrust có thể hoạt động được hiệu quả hơn. Nếu sử dụng phiên bản đầu
tiên của WikiTrust sẽ mất khoảng 20 ngày để xử lý dữ liệu có được trong
vòng 5 năm trên Wikipedia. Phiên bản mới nhất của WikiTrust giảm thời
gian xử lý xuống còn 5 ngày để giải quyết cùng một lượng dữ liệu như
vậy. Trung bình mỗi giây chương trình có thể đánh giá, chấm điểm 30-40
bài.
“Đó chỉ là lượng công việc mà chỉ một máy có thể đảm nhận. Như vậy việc Wikipedia áp dụng dự án này là hoàn toàn khả thi.”, Adler nói thêm.
Số đông hay chuyên gia sẽ đúng
Theo
ông Chi, còn một vấn đề nữa là chương trình này chưa được thử nghiệm
trên một lượng lớn người sử dụng. Và ông cho rằng chưa chắc người sử
dụng thấy được lợi ích của chương trình này đem lại cho họ. Mặc dù,
nhóm nghiên cứu của ông có cùng chung quan điểm với những người thực
hiện đề án này của Wikipedia nhưng họ đã đưa ra quyết định là không
thực hiện đến cùng dự án này.
Ông Chi cho biết: “Tôi
không chắc rằng chương trình này sẽ có tác dụng đối với những độc giả
thông thường. Họ nhận ra quá nhiều vấn đề liên quan đến độ tin cậy của
thông tin mà họ đọc, ngoài ra nó còn ảnh hưởng đến mục đích chỉ đơn
thuần lấy thông tin của họ.”
Các nhà nghiên cứu của phòng
thí nghiệm Wiki cũng lo ngại rằng việc áp dụng WikiTrust sẽ làm giảm uy
tín của bách khoa toàn thư mở Wikipedia. Vì vậy nên họ thực hiện dự án
này một cách kín đáo hết mức có thể. Bởi nếu trong các bài viết của
Wikipedia xuất hiện quá nhiều các bài viết bị phủ dải màu cam thì sẽ
làm giảm lượng độc giả của trang web.
Họ
cân bằng nhu cầu của độc giả bằng cách chỉ ra bài viết có vấn đề về độ
chính xác của nội dung mà vẫn giữ bài viết ở trạng thái có thể đọc được
đối với những độc giả khác. Họ cũng thiết kế công cụ này ẩn trên thanh
công cụ phía trên cùng của màn hình. Vì vậy nên nếu độc giả không quan
tâm đến thông tin đó được chấm điểm độ chính xác là bao nhiêu thì chỉ
cần không kích chuột vào công cụ Trust info là được.
Chương
trình WikiTrust có khả năng phát hiện ra nội dung mọi bài viết thông
tin có vấn đề về độ tin cậy. Nhưng khi được hỏi thước đo nào ông De
Alfaro áp dụng để đo độ tin cậy của thông tin trên Wikipedia thì ông
lại do dự.
Chương trình WikiTrust xếp độ tin cậy của thông tin
dựa trên số lượng bao nhiêu người đồng ý với thông tin trong một đoạn
cụ thể mà bài viết đó đưa ra. Nhưng việc đa số đồng ý với thông tin đó
không có nghĩa là thông tin đó là hoàn toàn chính xác. Ông De Alfaro
cho biết: “Nếu như cả 20 người đưa ra đánh giá đều suy nghĩ theo một
cách thì công cụ này hoàn toàn không thể nhận biết được điều đó. Công
cụ này chỉ đơn giản là xác định có bao nhiêu đánh giá trùng đối với một
đoạn văn bản mà thôi.”
Việc xác định độ chính xác của thông
tin dựa vào số đông dường như còn thiếu tính chính xác nhưng quan điểm
của số đông người trong xã hội thường là đúng. Như bách khoa toàn thư
thế kỷ 15 cho rằng mặt trời quay xung quanh trái đất. Phiên bản tiếng
Anh của bách khoa toàn thư năm 1911 cho rằng vi khuẩn là nguyên nhân
gây nên bệnh cúm, thời gian đó thế giới vẫn chưa phát hiện ra sự có mặt
của virut.
Vì
vậy có thể chưa chắc ý kiến của số đông đã là chính xác nhưng với một
thông tin được đưa ra thì bạn chọn quan điểm của bên nào nếu một bên là
các chuyên gia, một bên là quan điểm của hàng nghìn người sử dụng
Internet trên toàn cầu và thuật toán của một chiếc máy tính thông minh?