چند روز پیش اسنادی 2500 صفحهای از سازوکارهای موتور جستجوی گوگل افشا شد که این شرکت نیز صحت آن را تأیید کرد. اگرچه این اسناد الگوریتم این موتور جستجو را فاش نمیکند، اما دارای اطلاعات بسیار ارزشمندی است که فرایندهای درونی گوگل را نشان میدهد، فرایندهایی که معمولاً افشا نمیشوند. اما حالا میخواهیم نگاهی مختصر به برخی از اطلاعات مهم این اسناد داشته باشیم.
به گزارش سرویس اخبار اینترنت و شبکه سایت شات ایکس و به نقل از دیجیاتو احتمالاً برجستهترین نکته درباره این اسناد وجود اطلاعاتی است که نشان میدهد نمایندگان گوگل در گذشته، هنگامی که درباره ارزیابی و رتبهبندی محتواها توسط این موتور جستجو صحبت میکردند، مخاطبان را فریب داده بودند.
اینکه گوگل چگونه محتواها را رتبهبندی میکند درون یک جعبه سیاه اتفاق میافتد. بسیاری از وبسایتها برای بقای خود به ترافیک حاصل از موتور جستجو متکی هستند، و خیلی از آنها تلاش – و هزینه – زیادی میکنند تا از رقبا پیشی بگیرند و در نتایج رتبه خود را ارتقا دهند. رتبه بهتر بهمعنای بازدیدکننده بیشتر، و در نتیجه، درآمد بیشتر است. ازاینرو، گردانندگان سایتها به تکتک دادههایی که از جانب گوگل یا کارمندان آن منتشر میشود، توجه میکنند.
گوگل کاربران را فریب داده است؟
برای مثال، سخنگویان گوگل در طول سالهای اخیر بهدفعات نقش کلیکهای کاربر در رتبهبندی سایتها را رد کردهاند، اما اطلاعات افشاشده انواعی از کلیکهای کاربر را نشان میدهد و میگوید این کلیکها در رتبهبندی صفحات در موتورهای جستجو اعمال میشود.
«رند فیشکین»، متخصص بهینهسازی موتور جستجو (SEO) که در کنار «مایک کینگ» به دیدهشدن این اسناد افشاشده کمک کردند، میگوید: «برای من، نکته مهمتر و کلیتر این است که شواهد محکمی علیه بسیاری از اظهارات عمومی گوگل درباره اینکه آنها چه دادههایی را گردآوری میکنند و موتور جستجویشان چگونه کار میکند، وجود دارد.»
اطلاعات فاششده حاوی مخازنی مملو از دادههای مختلف درباره گردآوری محتوا توسط گوگل است و برخی از این موارد ممکن است بر نحوه رتبهبندی صفحات در موتور جستجو تأثیر بگذارد. در ابتدا گوگل درباره صحت این اسناد واکنشی نشان نداد، اما بعداً آن را تأیید کرد.
در بیانیه این شرکت آمده است: «ما نسبت به ایجاد فرضیات نادرست درباره نتایج جستجوها براساس اطلاعات قدیمی یا ناقص هشدار میدهیم. ما اطلاعات زیادی درباره نحوه عملکرد موتور جستجوی خود و عواملی که سیستمهای ما مورد بررسی قرار میدهند، به اشتراک گذاشتهایم. درعینحال از یکپارچگی نتایج جستجوها در برابر دستکاری محافظت میکنیم.»
هیچ گواهی در این اسناد وجود ندارد که میزان اثرگذاری خصوصیات یا صفات (Attributes) مختلف را نشان دهد. این امکان وجود دارد که برخی از صفات موجود در میان این اطلاعات – نظیر شناسه «سایتهای شخصی کوچک» یا افت رتبه بهدلیل نقد محصول – در بخشی از سازوکار موتور جستجو پیادهسازی شده باشد، اما بهنظر میرسد که بعداً از رده خارج شده است. همچنین نمیتوان با قطعیت گفت که از آنها برای رتبهبندی سایتها استفاده شده است.
کینگ میگوید صرفنظر از توصیفاتی که برای مؤلفههای ذکرشده وجود دارد، لزوماً نمیدانیم که چگونه از آنها استفاده میشود. از طرفی، اگرچه اطلاعات درباره آنها پراکنده است، اما میتوانیم دادههای زیادی را در این زمینه مشاهده کنیم.
اینکه بزرگترین پلتفرم جستجوی جهان رتبهبندی نتایج جستجوی خود را مبتنی بر چگونگی تعامل کاربر با محتوا تنظیم نکند، در ظاهر غیرمنطقی بهنظر میرسد. ولی تکذیبهای مکرر، استفاده از کلمات دقیق در پاسخهای گوگل ، و مطالب گوناگونی که این ادعاها را تکرار میکنند، باعث شده تا این مبحث در میان متخصصان سئو
به یک موضوع بحثبرانگیز تبدیل شود.
موتور جستجوی گوگل از کروم اطلاعات میگیرد
نکته مهم دیگری که فیشکین و کینگ به آن اشاره کردهاند، به چگونگی استفاده از دادههای کروم در رتبهبندی جستجو مربوط میشود. نمایندگان گوگل قبلاً گفته بودند که این شرکت از دادههای کروم برای رتبهبندی استفاده نمیکند، اما اسناد افشاشده ممکن است خلاف این قضیه را نشان دهد. برای مثال، در یک بخش به chrome_trans_clicks اشاره شده که ظاهراً مشخص میکند کدام لینکها از یک دامنه باید در قالب زیرمجموعه آن در نتایج جستجو نمایش داده شوند. فیشکین معتقد است که این یعنی گوگل از تعداد کلیک روی صفحات در کروم استفاده میکند تا محبوبترین یا مهمترین صفحات را بهدست آورد و آنها را در نتایج جستجو نشان دهد.
در فایلهای فاششده بیش از 14 هزار صفت وجود دارد، و محققان هفتهها زمان صرف بررسی این اطلاعات خواهند کرد. در این اسناد به «ورروندهها» (Twiddlers) نیز اشاره شده که ظاهراً سازوکارهایی برای تعیین رتبه در خارج از بهروزرسانیهای بزرگ سیستمی است. این دستکاریها منجر به تقویت یا افت رتبه یک محتوا براساس یک معیار خاص میشود. عناصر صفحات وب، نظیر اینکه نویسنده کیست، هم بهعنوان میزان «اعتبار» سایتها ذکر میشود. فیشکین میگوید بسیاری موارد دیگر مثل محتواهای خلقشده با هوش مصنوعی نیز وجود دارد که در این اسناد به آنها اشاره نشده است.
همه اینها برای افرادی که درون صنعت SEO کار نمیکنند، به چه معناست؟ در وهله اول، باید انتظار داشت که همه گردانندگان وبسایتها این اطلاعات فاششده را بخوانند و سعی کنند از آنها سر در بیاورند. ترفندهای زیادی به کار گرفته خواهد شد تا مشخص شود که کدام مواد جواب میدهد. ناشران، شرکتهای تجاری و کسبوکارها هم احتمالاً آزمایشهای گوناگونی انجام میدهند تا دادههای ارائهشده در این اسناد را آزمایش کنند. بنابراین میتوان حدس زد که در آینده ظاهر و محتوای وبسایتها تغییر کند.
فیشکین میگوید: «خبرنگاران و کسانی که اطلاعات مربوط به سئو و گوگل سرچ را منتشر میکنند، باید از نقلقول چشمبسته بیانیههای عمومی گوگل دست بردارند، و نگاه سختگیرانهتر و دقیقتری به گفتههای نمایندگان این غول موتور جستجو داشته باشند. هنگامی که رسانهها ادعاهای گوگل را بهنحوی تکرار میکنند که گویی حقیقت دارند، آنها درحال کمک به روایتی از داستان گوگل هستند که تنها برای این شرکت مفید است، نه برای متخصصان، کاربران یا عموم مردم.»