Thứ ba, 08/09/2009, 12:59 GMT+7
Hãy tin vào wikipedia... màu trắng!
Các nhà nghiên cứu từ phòng thí nghiệm Wiki thuộc trường đại học California, Santa Cruz vừa thiết kế ra một hệ thống giúp người sử dụng phân biệt được thông tin nào Wikipedia cung cấp có thể tin cậy được, thông tin nào thì không.

Dải màu càng nhạt, thông tin càng đáng tin

Wikipedia vừa cho ra mắt công cụ WikiTrust giúp độc giả của trang bách khoa toàn thư mở này có thêm cơ sở để tin tưởng vào nội dung những bài viết của trang web bản tiếng Anh. Thanh công cụ này sẽ tô màu lên tất cả những từ trong các bài viết dựa trên độ tin cậy của thông tin mà tác giả cung cấp và thời gian thông tin đó tồn tại trên trang web.

Trung bình mỗi tháng có hơn 60 triệu lần truy cập vào Wikipedia để tìm kiếm tài liệu trong kho dữ liệu với hơn 12 triệu bài viết được thể hiện dưới 260 ngôn ngữ khác nhau.

Mặc dù trang web này được rất nhiều người sử dụng nhưng vẫn có một lượng lớn độc giả cho rằng những thông tin mà trang web cung cấp là không đáng tin cậy.

Lý do họ đưa ra là nội dung các bài viết trên Wikipedia do các độc giả tự nguyện đóng góp, bất cứ ai kết nối Internet cũng có thể cung cấp thông tin cho Wikipedia. Vì vậy, những bài viết trong trang web này có xu hướng lộn xộn, những thông tin có thể không chính xác hay sai lệch hoàn toàn để phục vụ ý đồ cá nhân của những người giấu tên.

WikiTrust đánh dấu màu sắc lên nội dung thông tin mới được đưa vào các bài viết trong trang web. Biện pháp này căn cứ vào mức độ kinh nghiệm của tác giả bài viết từ việc xác định thời gian tồn tại của những thông tin trước đây mà tác giả đó cung cấp cho trang này. Quy luật rất đơn giản: Thông tin tồn tại càng lâu trên các bài viết trên Wikipedia thì độ tin cậy của thông tin càng cao.

Màu màu da cam đậm: Những bài viết được lấy từ những nguồn có nghi vấn, chưa xác định được độ chính xác

Màu cam nhạt: Những bài viết lấy từ những nguồn thông tin đáng tin cậy hơn

Màu trắng: Những bài viết thông tin tin cậy (căn cứ là càng có nhiều lượt người truy cập, bổ sung, sửa đổi thông tin trong bài viết đó)

Tuy không tham gia vào dự án lần này của Wikipedia, Chuyên gia phát triển phần mềm Wikipedia, nhà khoa học nghiên cứu các nơ ron thần kinh, Virgil Griffith của Viện nghiên cứu công nghệ California cho rằng:  "Dự án này được áp dụng quy luật tự nhiên của Darwin. Mọi người đều có quyền thêm thông tin vào những bài viết của Wikipedia. Nội dung những bài viết sẽ xuất hiện nhiều thông tin không chính xác nhưng những thông tin không chính xác đó sẽ không tồn tại được lâu mà theo thời gian nó sẽ bị loại bỏ.”

Chương trình WikiTrust được thực hiện do sự mở rộng của MediaWiki từ tháng 11 năm ngoái. Bất cứ ai sử dụng trang web của Wiki đều có thể tải miễn phí chương trình này và thêm tính năng sử dụng dải màu để phân biệt độ tin cậy của thông tin.

Những nhân vật cấp cao điều hành WikiMedia Foundation, một tổ chức phi lợi nhuận điều hành Wikipedia, đã đưa ra quyết định thêm đặc tính WikiTrust. Tất cả những thành viên đã đăng ký sử dụng Wikipedia đều có thể sử dụng công cụ màu sắc để phân biệt độ chính xác của thông tin bằng cách kích chuột vào thanh công cụ Trust info (thông tin tin cậy). Như vậy là họ đã có thể dễ dàng sử dụng dải màu của Wikipedia.

Sử dụng dải màu để phân loại độ tin cậy của thông tin liệu có khả thi?
Nguồn: wired.com

Dùng công cụ thông minh thay vì sức người

Luca de Alfaro, nhà khoa học máy tính làm việc cho phòng thí nghiệm UCSC Wiki, người phụ trách dự án WikiTrust cho biết: “Việc dựa vào các cộng tác viên điện tử để xây dựng nội dung cho trang web ngày càng trở nên phổ biến hơn trên toàn thế giới. Ngày càng có nhiều dịch vụ không thể tồn tại được mà không dựa vào kinh nghiệm của chính người sử dụng dịch vụ và sự tin tưởng của người sử dụng vào nội dung thông tin của dịch vụ đó đưa ra.”

De Alfaro nảy ra ý tưởng sử dụng kinh nghiệm của những thành viên đóng góp bài viết cho Wikipedia để phân loại thông tin khi chính trang web của ông bị một lượng lớn các thông tin “rác” đổ vào. “Tôi bắt đầu suy nghĩ xem có cách nào khuyến khích mọi người xây dựng nội dung thông tin cho trang web theo cách có hiệu quả hơn không?”.

Các trang web như Amazon.com, eBay sử dụng các thông tin do các cộng tác viên cung cấp, các cộng tác viên đánh giá chất lượng của nội dung thông tin đã trở nên nổi tiếng. Có rất nhiều người cho rằng Wikipedia nên áp dụng phương pháp này nhưng De Alfaro lại lo rằng nếu Wikipedia cho phép người sử dụng đánh giá chất lượng các bài viết trên Wikipedia sẽ gây ảnh hưởng tới môi trường cộng tác giữa người sử dụng và trang web.

Ông cũng không muốn những người biên tập nội dung trang web phải bận rộn hơn. Ông Alfaro phát biểu: “Nếu có trang web nào hoạt động tốt như Wikipedia thì sẽ rất khó cho người biên tập khi họ phải đưa ra đề xuất sửa đổi lời bình luận của mọi người khi xem xét bài viết của một người”.

Từ khi trang web đưa ra quyết định xem xét lại thông tin trong những bài viết của Wikipedia thì ông Alfaro nhận thấy là ông có thể sử dụng chính nguồn dữ liệu để tạo nên độ tin cậy của trang web. Biện pháp này hoàn toàn độc lập với những thông tin mà con người đưa vào.

Ông nói: “Máy móc có thể làm việc thay thế con người nên bạn có thể lấy được thông tin mà bạn cần mà không cần sử dụng đến nguồn nhân lực. Mục đích của bạn được thực hiện chỉ thông qua một công cụ thông minh thì điều đó sẽ tốt hơn nhiều.”

Chấm điểm kinh nghiệm cho thành viên

Phòng thí nghiệm Wiki đưa ra công cụ giúp xác định độ tin cậy của thông tin do mục tiêu của bách khoa toàn thư mở muốn nâng cao độ chính xác của nội dung các bài viết Wiki cung cấp. Hoặc ít nhất phòng thí nghiệm này phát minh ra công cụ nhằm thực hiện đồng bộ với mục tiêu trang web đề ra.

Bo Adler, một sinh viên tốt nghiệp UCSC, cùng cộng tác với De Alfaro trong việc phát triển WikiTrust cho rằng: “Độc giả có thể đo sự chính xác của thông tin mà tác giả bài viết đó đưa ra bằng cách xem xét thời gian tồn tại của thông tin bài viết trên trang web.”

Adler bổ sung thêm: “Khi độc giả thêm bất cứ thông tin nào vào Wikipedia mà thông tin đó tồn tại một thời gian dài thì điều đó có đồng nghĩa là độ chính xác của thông tin đó cao. Còn nếu như độc giả nào thêm thông tin vào bài viết mà thông tin đó bị xóa đi ngay lập tức thì nó cũng đồng nghĩa rằng thông tin đó không đáng tin cậy”.

Dựa theo những đóng góp trước đây cho trang web mà WikiTrust sẽ chấm điểm kinh nghiệm cho thành viên đó từ 0-9. Khi một người có đóng góp thông tin cho Wikipedia thì dải màu trên thông tin đó sẽ chuyển màu cam dựa vào số điểm kinh nghiệm của người đó: Nếu dải màu đó có màu cam càng đậm thì độ tin cậy của thông tin đó càng ít. Sau đó các tác giả khác sẽ sửa đổi thông tin có trong bài viết đó, và các độc giả sẽ cho điểm bài viết mới được sửa đổi đó.

Nếu như các độc giả đồng ý với nội dung bài viết thì nội dung đó sẽ được giữ nguyên, còn nếu không nội dung cả bài viết đó sẽ quay lại lúc chưa được sửa đổi. Dải màu trên bài viết đó sẽ nhạt dần theo thời gian nó tồn tại. Đó cũng đồng nghĩa với việc có nhiều tác giả đồng ý với nội dung bài viết đó.

Các nhà nghiên cứu quyết định không hiện mức độ kinh nghiệm của tác giả của các bài viết. Họ mong muốn bằng cách này sẽ khuyến khích các tác giả mới tham gia đóng góp bài viết cho bách khoa toàn thư mở. Ông De Alfaro nói: “Kể cả tác giả của bài viết có là một nhà sinh vật học lỗi lạc đi chăng nữa mà họ chưa có nhiều bài viết đóng góp cho Wikipedia thì bậc kinh nghiệm của họ do trang web xếp hạng vẫn thấp.”

Adler cũng cho hay: “Chúng tôi cố gắng phán đoán khi nào thì thông tin đó bị xóa. Chúng tôi muốn những thông tin bị xóa là những thông tin có độ tin cậy thấp và những thông tin không bị xóa là những thông tin có độ tin cậy cao.’’

Theo nhà khoa học máy tính Ed Chi của Trung tâm nghiên cứu Palo Alto, trung tâm phụ trách nghiên cứu Wikipedia và sự chứng nhận của xã hội, “Wikipedia không phải là một trang web có thiết kế và quy trình vận hành một cách thông thường.” Nếu WikiTrust muốn thực hiện chức năng chấm điểm tất cả các từ trong tất cả các bài viết thì sẽ tiêu tốn lượng năng lượng đáng kể và nó cần thêm vài Terabyte vào bộ nhớ phụ.

Nhưng những nhà nghiên cứu phòng thí nghiệm Wiki khẳng định, họ đã làm việc và tìm ra biện pháp giúp WikiTrust có thể hoạt động được hiệu quả hơn. Nếu sử dụng phiên bản đầu tiên của WikiTrust sẽ mất khoảng 20 ngày để xử lý dữ liệu có được trong vòng 5 năm trên Wikipedia. Phiên bản mới nhất của WikiTrust giảm thời gian xử lý xuống còn 5 ngày để giải quyết cùng một lượng dữ liệu như vậy. Trung bình mỗi giây chương trình có thể đánh giá, chấm điểm 30-40 bài.

Đó chỉ là lượng công việc mà chỉ một máy có thể đảm nhận. Như vậy việc Wikipedia áp dụng dự án này là hoàn toàn khả thi.”, Adler nói thêm.

Số đông hay chuyên gia sẽ đúng

Theo ông Chi, còn một vấn đề nữa là chương trình này chưa được thử nghiệm trên một lượng lớn người sử dụng. Và ông cho rằng chưa chắc người sử dụng thấy được lợi ích của chương trình này đem lại cho họ. Mặc dù, nhóm nghiên cứu của ông có cùng chung quan điểm với những người thực hiện đề án này của Wikipedia nhưng họ đã đưa ra quyết định là không thực hiện đến cùng dự án này.

Ông Chi cho biết: “Tôi không chắc rằng chương trình này sẽ có tác dụng đối với những độc giả thông thường. Họ nhận ra quá nhiều vấn đề liên quan đến độ tin cậy của thông tin mà họ đọc, ngoài ra nó còn ảnh hưởng đến mục đích chỉ đơn thuần lấy thông tin của họ.”

Các nhà nghiên cứu của phòng thí nghiệm Wiki cũng lo ngại rằng việc áp dụng WikiTrust sẽ làm giảm uy tín của bách khoa toàn thư mở Wikipedia. Vì vậy nên họ thực hiện dự án này một cách kín đáo hết mức có thể. Bởi nếu trong các bài viết của Wikipedia xuất hiện quá nhiều các bài viết bị phủ dải màu cam thì sẽ làm giảm lượng độc giả của trang web.

Họ cân bằng nhu cầu của độc giả bằng cách chỉ ra bài viết có vấn đề về độ chính xác của nội dung mà vẫn giữ bài viết ở trạng thái có thể đọc được đối với những độc giả khác. Họ cũng thiết kế công cụ này ẩn trên thanh công cụ phía trên cùng của màn hình. Vì vậy nên nếu độc giả không quan tâm đến thông tin đó được chấm điểm độ chính xác là bao nhiêu thì chỉ cần không kích chuột vào công cụ Trust info là được.

Chương trình WikiTrust có khả năng phát hiện ra nội dung mọi bài viết thông tin có vấn đề về độ tin cậy. Nhưng khi được hỏi thước đo nào ông De Alfaro áp dụng để đo độ tin cậy của thông tin trên Wikipedia thì ông lại do dự.

Chương trình WikiTrust xếp độ tin cậy của thông tin dựa trên số lượng bao nhiêu người đồng ý với thông tin trong một đoạn cụ thể mà bài viết đó đưa ra. Nhưng việc đa số đồng ý với thông tin đó không có nghĩa là thông tin đó là hoàn toàn chính xác. Ông De Alfaro cho biết: “Nếu như cả 20 người đưa ra đánh giá đều suy nghĩ theo một cách thì công cụ này hoàn toàn không thể nhận biết được điều đó. Công cụ này chỉ đơn giản là xác định có bao nhiêu đánh giá trùng đối với một đoạn văn bản mà thôi.”

Việc xác định độ chính xác của thông tin dựa vào số đông dường như còn thiếu tính chính xác nhưng quan điểm của số đông người trong xã hội thường là đúng. Như bách khoa toàn thư thế kỷ 15 cho rằng mặt trời quay xung quanh trái đất. Phiên bản tiếng Anh của bách khoa toàn thư năm 1911 cho rằng vi khuẩn là nguyên nhân gây nên bệnh cúm, thời gian đó thế giới vẫn chưa phát hiện ra sự có mặt của virut.

Vì vậy có thể chưa chắc ý kiến của số đông đã là chính xác nhưng với một thông tin được đưa ra thì bạn chọn quan điểm của bên nào nếu một bên là các chuyên gia, một bên là quan điểm của hàng nghìn người sử dụng Internet trên toàn cầu và thuật toán của một chiếc máy tính thông minh?

  • Đinh Hiền (Theo Wired)

 

bantinsom.com ( theo tuanvietnam )