Компанія Google назвала автентичною витік колекції з 2 500 внутрішніх документів Google, що містять деталі про дані, які використовує компанія під час ранжування результатів пошуку. Документи детально описують дані, які відстежує Google, і деякі з них можуть бути використані в його алгоритмі ранжування пошуку, що ретельно охороняється.
Як зазначає The Verge, витік пропонує безпрецедентний, хоча й досі туманний погляд під капот однієї з найпослідовніших систем, що формують інтернет.
На існування витоку матеріалів вперше вказали експерти з пошукової оптимізації (SEO) Ренд Фішкін і Майк Кінг, кожен з яких опублікував попередній аналіз документів та їхнього змісту на початку цього тижня. Google не відповів на численні вчорашні запити The Verge прокоментувати автентичність витоку.
Витік матеріалів свідчить про те, що Google збирає і потенційно використовує дані, які, як стверджують представники компанії, не впливають на ранжування вебсторінки у пошуку Google, як-от кліки, дані користувачів Chrome тощо. Тисячі сторінок документів слугують сховищем інформації для співробітників Google, але незрозуміло, які саме дані насправді використовуються для ранжування пошукового контенту — інформація може бути застарілою, використовуватися виключно в навчальних цілях або збиратися, але не використовуватися саме для пошуку. Документи також не розкривають, як різні елементи зважуються в пошуку, і чи зважуються взагалі.
З усім тим, оприлюднена інформація, ймовірно, спричинить хвилювання в галузі SEO, маркетингу та видавничої справи. Зазвичай Google зберігає високу секретність щодо того, як працює його пошуковий алгоритм, але ці документи — разом із нещодавніми свідченнями в антимонопольній справі Міністерства юстиції США — внесли більше ясності щодо того, про які сигнали Google думає, коли йдеться про ранжування вебсайтів.
Рішення, які Google приймає щодо пошуку, мають глибокий вплив на всіх, хто покладається на інтернет для ведення бізнесу, від невеликих незалежних видавництв до ресторанів та інтернет-магазинів. Своєю чергою, з’явилася ціла індустрія людей, які сподіваються зламати код або перехитрити алгоритм, що дає іноді суперечливі відповіді. Невизначеність і недорікуватість Google не допомогли, але наплив внутрішніх документів дає принаймні уявлення про те, що думає компанія, яка домінує в інтернеті.