 |
| Ảnh: Blogote. |
Cuối tháng 2, Google tuyên bố cải tổ công thức xếp
hạng website, theo đó những trang có "chất lượng thấp" sẽ bị giáng cấp.
Google không nêu đích danh những site này, nhưng các chuyên gia phân
tích tin rằng đó là những website chuyên tập hợp thông tin từ những
nguồn khác, chứa những từ khóa thường xuyên được người sử dụng nhập vào
công cụ tìm kiếm nhằm lôi kéo lượng truy cập từ Google và thu hút nguồn
quảng cáo.
Essortment, một trong những site như thế, đã
bị tụt hạng đáng kể sau khi Google thay đổi thuật toán. Một bài viết
điển hình trên trang này: "25 điều thú vị để làm cùng bạn gái",
bao gồm các từ khóa phổ thông trên Google Search như "nấu ăn", "chạy",
"cắm trại", "mua sắm". Ngoài ra, nó cũng chứa những "thỏi nam châm" thu
hút sự chú ý như "bạn gái", "hẹn hò", "hôn nhân" và "độc thân". Và trang
chứa bài viết "25 điều thú vị" này tràn ngập quảng cáo.
Động thái mới của Google cũng ảnh hưởng đến nhiều công
ty hoạt động trong lĩnh vực SEO (tối ưu công cụ tìm kiếm). Chẳng hạn,
công ty Mahalo thừa nhận họ đã đầu tư hàng triệu USD xây dựng những dự
án "spam", tạo hàng trăm trang có chủ đề giống nhau nhằm tăng thứ hạng
cho website của khách hàng. Tuy nhiên, thay đổi của Google khiến chiến
lược của họ chệch hướng và ảnh hưởng nghiêm trọng tới nguồn thu.
Vấn đề đặt ra với chủ sở hữu website hiện nay là cần
hiểu Google coi một trang như thế nào là "chất lượng thấp", họ phải làm
gì để công cụ tìm kiếm của Google đánh giá cao và Google sẽ còn xây dựng
thuật toán gì trong tương lai khi đánh giá và xếp hạng một trang web.
Máy tính chỉ thông minh nhờ thuật toán - những phần
mềm do chính con người viết ra. Khi chạy trên một cỗ máy siêu mạnh, một
thuật toán thông minh có thể làm nên những chiến công đáng kinh ngạc,
như thuật toán của Google có thể xử lý 1 tỷ câu lệnh tìm kiếm mỗi ngày.
Tuy nhiên, máy tính không phải con người. Chúng không
có kiến thức nền, có sắc thái và sự nhạy cảm. Chúng thông minh dựa trên
những tác vụ được lập trình sẵn như chơi cờ, quét thông tin. Giữa tháng
2, máy tính Watson của IBM đã đánh bại 2 người chơi
xuất sắc của chương trình đố vui Jeopardy. Nhưng trong quá
trình đến vinh quang, Watson đôi khi vẫn đưa ra những đáp án ngớ ngẩn
đến mức khán giả phải bật cười và lắc đầu.
"Để máy tính hiểu ngôn ngữ như một đứa trẻ lên 8 khó
hơn nhiều so với việc đánh bại một bậc thầy về cờ vua", Oren Etzioni,
nhà khoa học tại Đại học Washington (Mỹ), nhận định trên báo The New
York Times.
Máy tính không thể thực sự hiểu các từ ngữ. Thay vào
đó, thuật toán của nó quét qua hàng núi văn bản để tính toán tần suất
xuất hiện của các từ khóa. Do đó, một trang web có nội dung dở nhưng
được "cày cấy" nhiều từ khóa phổ biến sẽ vẫn có thể đứng đầu kết quả tìm
kiếm - mục tiêu hàng đầu của các website, nhất là trong lĩnh vực tin
tức và thương mại điện tử.
Google thường xuyên chỉnh sửa thuật toán nhưng hiếm
khi thực hiện đợt cải tổ lớn như vừa rồi. Giới quan sát cho rằng trong
tương lai, thứ hạng website sẽ được nhìn nhận theo cách khác khi Google
hay Microsoft Bing trở thành cỗ máy trả lời như Watson. Chẳng hạn, người
sử dụng hỏi: "Tòa nhà Bitexco Finacial Tower có bao nhiêu tầng" và kết
quả họ nhận được không phải là các đường link mà là câu trả lời "68
tầng".