Khi Google tăng cường hơn nữa vào AI, các nhà xuất bản nhận thấy những thách thức mới
As Google pushes deeper into AI, publishers see fresh challenges
Bạn có thể không bao giờ phải đọc một câu chuyện tin tức nào khác trong đời nếu bạn có trí tuệ nhân tạo có thể xử lý tất cả thông tin trên web và đưa ra bản tóm tắt theo yêu cầu.
You may never have to read another news story in your life, if you have artificial intelligence that can digest all the web’s information and serve up a summary on demand.
Đó là cơn ác mộng đối với các ông trùm truyền thông khi Google và những công ty khác thử nghiệm cái gọi là AI tổng quát, tạo ra nội dung mới dựa trên dữ liệu trong quá khứ.
That’s the stuff of nightmares for media barons as Google and others experiment with what's called generative AI, which creates new content drawing from past data.
Kể từ tháng 5, Google đã bắt đầu triển khai một hình thức tìm kiếm mới được hỗ trợ bởi AI tổng hợp, sau khi các nhà quan sát trong ngành đặt câu hỏi về sự nổi bật trong tương lai của gã khổng lồ công nghệ trong việc cung cấp thông tin cho người tiêu dùng sau sự nổi lên của chatbot trả lời truy vấn của OpenAI, ChatGPT.
Since May, Google has begun rolling out a new form of search powered by generative AI, after industry observers questioned the tech giant's future prominence in providing consumers with information following the rise of OpenAI's query-answering chatbot, ChatGPT.
Sản phẩm có tên Search Generative Experience (SGE), sử dụng AI để tạo bản tóm tắt đáp lại một số truy vấn tìm kiếm, được kích hoạt bởi liệu hệ thống của Google có xác định định dạng này có hữu ích hay không. Những bản tóm tắt đó xuất hiện ở đầu trang chủ tìm kiếm của Google, với các liên kết để “tìm hiểu sâu hơn”, theo tổng quan của Google về SGE.
The product, called Search Generative Experience (SGE), uses AI to create summaries in response to some search queries, triggered by whether Google’s system determines the format would be helpful. Those summaries appear on the top of the Google search homepage, with links to “dig deeper,” according to Google’s overview of SGE.
Nếu nhà xuất bản muốn ngăn AI của Google sử dụng nội dung của họ để giúp tạo ra những bản tóm tắt đó, thì họ phải sử dụng cùng một công cụ có thể ngăn chúng xuất hiện trong kết quả tìm kiếm của Google, khiến chúng hầu như không hiển thị trên web.
If publishers want to prevent their content from being used by Google’s AI to help generate those summaries, they must use the same tool that would also prevent them from appearing in Google search results, rendering them virtually invisible on the web.
Ví dụ: tìm kiếm “Jon Fosse là ai” - người đoạt giải Nobel Văn học gần đây - sẽ tạo ra ba đoạn văn về nhà văn và tác phẩm của ông. Các nút thả xuống cung cấp liên kết đến nội dung của Fosse trên Wikipedia, NPR, The New York Times và các trang web khác; các liên kết bổ sung xuất hiện ở bên phải của bản tóm tắt.
Searching for “Who is Jon Fosse” – the recent Nobel Prize in Literature winner – for instance, generates three paragraphs on the writer and his work. Drop-down buttons provide links to Fosse content on Wikipedia, NPR, The New York Times and other websites; additional links appear to the right of the summary.
Google cho biết các thông tin tổng quan do AI tạo ra được tổng hợp từ nhiều trang web và các liên kết được thiết kế để trở thành điểm xuất phát để tìm hiểu thêm. Nó mô tả SGE như một thử nghiệm chọn tham gia cho người dùng, nhằm giúp nó phát triển và cải thiện sản phẩm, đồng thời kết hợp phản hồi từ các nhà xuất bản tin tức và những người khác.
Google says that the AI-generated overviews are synthesized from multiple web pages and that the links are designed to be a jumping-off point to learn more. It describes SGE as an opt-in experiment for users, to help it evolve and improve the product, while it incorporates feedback from news publishers and others.
Đối với các nhà xuất bản, công cụ tìm kiếm mới là lá cờ đỏ mới nhất trong mối quan hệ kéo dài hàng thập kỷ mà cả hai đều phải vật lộn để cạnh tranh với Google về quảng cáo trực tuyến và phụ thuộc vào gã khổng lồ công nghệ về lưu lượng tìm kiếm.
To publishers, the new search tool is the latest red flag in a decades-long relationship in which they have both struggled to compete against Google for online advertising and relied on the tech giant for search traffic.
Theo bốn nhà xuất bản lớn, sản phẩm vẫn đang phát triển này – hiện đã có mặt ở Hoa Kỳ, Ấn Độ và Nhật Bản – đã gây lo ngại cho các nhà xuất bản khi họ cố gắng tìm ra vị trí của mình trong một thế giới nơi AI có thể thống trị cách người dùng tìm kiếm và trả tiền cho thông tin, một người đã nói chuyện với Reuters với điều kiện giấu tên để tránh làm phức tạp các cuộc đàm phán đang diễn ra với Google.
The still-evolving product – now available in the United States, India and Japan – has raised concerns among publishers as they try to figure out their place in a world where AI could dominate how users find and pay for information, according to four major publishers who spoke to Reuters on the condition of anonymity to avoid complicating ongoing negotiations with Google.
Những lo ngại đó liên quan đến lưu lượng truy cập trang web, liệu các nhà xuất bản có được coi là nguồn thông tin xuất hiện trong các bản tóm tắt của SGE hay không và tính chính xác của những bản tóm tắt đó hay không, các nhà xuất bản đó cho biết. Đáng kể nhất, các nhà xuất bản muốn được trả thù lao cho nội dung mà Google và các công ty AI khác đào tạo các công cụ AI của họ – một điểm mấu chốt xung quanh AI.
Those concerns relate to web traffic, whether publishers will be credited as the source of information that appears in the SGE summaries, and the accuracy of those summaries, those publishers say. Most significantly, publishers want to be compensated for the content on which Google and other AI companies train their AI tools – a major sticking point around AI.
Người phát ngôn của Google cho biết trong một tuyên bố: “Khi chúng tôi đưa AI sáng tạo vào Tìm kiếm, chúng tôi sẽ tiếp tục ưu tiên các phương pháp tiếp cận mang lại lưu lượng truy cập có giá trị cho nhiều người sáng tạo, bao gồm cả các nhà xuất bản tin tức, để hỗ trợ một trang web mở, lành mạnh”.
A Google spokesperson said in a statement: “As we bring generative AI into Search, we’re continuing to prioritize approaches that send valuable traffic to a wide range of creators, including news publishers, to support a healthy, open web.”
Về phần đền bù, Google cho biết họ đang nỗ lực phát triển sự hiểu biết tốt hơn về mô hình kinh doanh của các ứng dụng AI tổng quát và nhận ý kiến đóng góp từ các nhà xuất bản và những người khác.
On compensation, Google says it is working to develop a better understanding of the business model of generative AI applications and get input from publishers and others.
Vào cuối tháng 9, Google đã công bố một công cụ mới, được gọi là Google-Extends, cung cấp cho các nhà xuất bản tùy chọn chặn nội dung của họ bị Google sử dụng để đào tạo các mô hình AI của mình.
In late September Google announced a new tool, called Google-Extended, that gives publishers the option to block their content from being used by Google to train its AI models.
Danielle Coffey, chủ tịch và giám đốc điều hành của News Media Alliance, một nhóm thương mại trong ngành đã vận động Quốc hội về những vấn đề này, cho biết việc cung cấp cho các nhà xuất bản tùy chọn từ chối thu thập thông tin cho AI là một “cử chỉ thiện chí”. “Liệu các khoản thanh toán có tuân theo hay không vẫn là một dấu hỏi và mức độ cởi mở để trao đổi giá trị lành mạnh hơn.”
Giving publishers the option to opt out of being crawled for AI is a “good faith gesture,” said Danielle Coffey, president and chief executive of the News Media Alliance, an industry trade group that has been lobbying Congress over these issues. “Whether payments will follow is a question mark, and to what extent there is openness to having a healthier value exchange.”
Công cụ mới không cho phép nhà xuất bản chặn thu thập dữ liệu nội dung của họ cho SGE, kể cả các bản tóm tắt hoặc liên kết xuất hiện cùng với họ mà không biến mất khỏi tìm kiếm Google truyền thống.
The new tool doesn’t allow publishers to block their content from being crawled for SGE, either the summaries or the links that appear with them, without disappearing from traditional Google search.
Nhà xuất bản muốn các nhấp chuột để đảm bảo an toàn cho nhà quảng cáo và việc hiển thị trong tìm kiếm của Google là chìa khóa cho hoạt động kinh doanh của họ. Theo một giám đốc điều hành của một trong những nhà xuất bản, thiết kế của SGE đã đẩy các liên kết xuất hiện trong tìm kiếm truyền thống xuống sâu hơn trên trang, có khả năng làm giảm lưu lượng truy cập đến các liên kết đó tới 40%.
Publishers want clicks to secure advertisers, and showing up Google search is key to their business. The design for SGE has pushed the links that appear in traditional search further down the page, with the potential to reduce traffic to those links by as much as 40 percent, according to an executive at one of the publishers.
Đáng báo động hơn là khả năng những người lướt web sẽ tránh nhấp vào bất kỳ liên kết nào nếu đoạn SGE đáp ứng được nhu cầu thông tin của người dùng – ví dụ: hài lòng khi tìm hiểu thời điểm tốt nhất trong năm để đến Paris mà không cần phải nhấp vào trang web của ấn phẩm du lịch.
More alarming is the possibility that web surfers will avoid clicking any of the links if the SGE passage fulfills the users’ need for information – satisfied, for example, to learn the best time of year to go to Paris, without having to click on a travel publication’s website.
Nhà phân tích cấp cao Nikhil Lai của Forrester Research cho biết SGE “chắc chắn sẽ làm giảm lưu lượng truy cập không phải trả tiền của nhà xuất bản và họ sẽ phải suy nghĩ về một cách khác để đo lường giá trị của nội dung đó, nếu không phải là tỷ lệ nhấp chuột”. Mặc dù vậy, ông tin rằng danh tiếng của các nhà xuất bản sẽ vẫn mạnh mẽ do các liên kết của họ xuất hiện trên SGE.
SGE is “definitely going to decrease publishers’ organic traffic and they’re going to have to think about a different way to measure the value of that content, if not click-through rate,” said Forrester Research Senior Analyst Nikhil Lai. Even so, he believes publishers’ reputations will remain strong as a result of their links appearing in SGE.
Google cho biết họ thiết kế SGE để làm nổi bật nội dung web. Người phát ngôn của công ty cho biết: “Bất kỳ ước tính nào về tác động lưu lượng truy cập cụ thể đều mang tính suy đoán và không mang tính đại diện, vì những gì bạn thấy ngày hôm nay trên SGE có thể trông khá khác so với những gì cuối cùng được ra mắt rộng rãi hơn trong Tìm kiếm”.
Google says that it designed SGE to highlight web content. “Any estimates about specific traffic impacts are speculative and not representative, as what you see today in SGE may look quite different from what ultimately launches more broadly in Search,” a company spokesperson said in a statement.
Các nhà xuất bản này cho biết, mặc dù các nhà xuất bản và các ngành khác đã dành nhiều thập kỷ để điều chỉnh trang web của họ để hiển thị nổi bật trong tìm kiếm truyền thống của Google, nhưng họ không có đủ thông tin để làm điều tương tự cho các bản tóm tắt SGE mới.
While publishers and other industries have spent decades adjusting their websites to show up prominently in traditional Google search, they don’t have enough information to do the same for the new SGE summaries, these publishers say.
“Phần AI mới là một hộp đen đối với chúng tôi,” một giám đốc điều hành của một nhà xuất bản cho biết. “Chúng tôi không biết làm cách nào để đảm bảo rằng chúng tôi là một phần của nó hoặc thuật toán đằng sau nó”.
“The new AI section is a black box for us,” said an executive at one publisher. “We don’t know how to make sure we’re a part of it or the algorithm behind it.”
Google cho biết các nhà xuất bản không cần phải làm bất cứ điều gì khác với những gì họ đã làm để xuất hiện trong tìm kiếm.
Google said publishers do not need to do anything different than what they have been doing to appear in search.
Các nhà xuất bản từ lâu đã cho phép Google "thu thập dữ liệu" nội dung của họ nhằm mục đích xuất hiện trong kết quả tìm kiếm - sử dụng bot hoặc một phần mềm để tự động quét và lập chỉ mục nội dung đó. “Thu thập dữ liệu” là cách Google lập chỉ mục trang web để làm cho nội dung hiển thị trong tìm kiếm.
Publishers have long allowed Google to “crawl” their content for the purposes of appearing in search results – using a bot, or piece of software, to automatically scan and index it. “Crawling” is how Google indexes the web to make content show up in search.
Mối lo ngại của các nhà xuất bản với SGE tóm lại ở một điểm mấu chốt: Họ nói rằng Google đang thu thập miễn phí nội dung của họ để tạo các bản tóm tắt mà người dùng có thể đọc thay vì nhấp vào liên kết của họ và Google chưa rõ ràng về cách họ có thể làm như vậy. chặn nội dung được thu thập thông tin cho SGE.
Publishers’ concerns with SGE boil down to a key point: They say that Google is crawling their content, for free, to create summaries that users may read instead of clicking on their links, and that Google hasn’t been clear about how they can block content from being crawled for SGE.
Một nhà xuất bản cho biết công cụ tìm kiếm mới của Google “thậm chí còn đe dọa chúng tôi và doanh nghiệp của chúng tôi hơn cả một trình thu thập thông tin đang thu thập dữ liệu doanh nghiệp của chúng tôi một cách bất hợp pháp”.
Google’s new search tool, said one publisher, “is even more threatening to us and our business than a crawler that is crawling our business illegally.”
Google không bình luận về đánh giá đó.
Google did not comment on that assessment.
Theo dữ liệu độc quyền từ trình phát hiện nội dung AI Originality.ai, khi được cung cấp tùy chọn, các trang web sẽ chặn nội dung của họ được sử dụng cho AI nếu làm như vậy không ảnh hưởng đến tìm kiếm. Kể từ khi phát hành vào ngày 7 tháng 8, 27,4% các trang web hàng đầu đang chặn bot của ChatGPT – bao gồm The New York Times và Washington Post. Con số này được so sánh với 6% đang chặn Google-Extends kể từ khi phát hành vào ngày 28 tháng 9.
When given the option, websites are blocking their content from being used for AI if doing so doesn’t impact search, according to exclusive data from AI content detector Originality.ai. Since its August 7 release, 27.4 percent of top websites are blocking ChatGPT’s bot – including The New York Times and Washington Post. That’s compared to six percent that are blocking Google Extended since its September 28 release.
Theo: Reuters
Content Writer: Anh Vũ