Yandex “bucato” ecco le novità SEO da sapere

Recentemente è stato scoperto che il codice sorgente di alcuni dei servizi chiave di Yandex è trapelato su internet. La società sta conducendo un’indagine interna per determinare come ciò sia accaduto, ma al momento non è stato confermato se si tratti di un attacco hacker o se il codice sia stato reso pubblico da un dipendente. L’incidente ha suscitato paragoni con la fuga di dati di RuTube del 2022 e ha sollevato preoccupazioni sulla sicurezza dei dati dell’azienda. Il servizio di sicurezza di Yandex ha dichiarato che l’attacco sembra essere mirato a danneggiare la reputazione dell’azienda e a screditarla.

Lato SEO quali sono le Implicazioni?

Secondo alcuni esperti del settore, questa violazione rappresenta una delle notizie più importanti nell’ambito della SEO degli ultimi dieci anni. Martin MacDonald, noto esperto di SEO, ha dichiarato: “La violazione di Yandex è probabilmente la cosa più interessante che sia successa in SEO negli ultimi anni”.

I fattori di classificazione trapelati, che ammontano a 1.922, sarebbero stati utilizzati da Yandex fino al luglio del 2022. Tuttavia, è importante sottolineare che Yandex non è Google e quindi non si può affermare che i fattori di classificazione utilizzati dal motore di ricerca russo siano gli stessi utilizzati da quello americano.

Nonostante ciò, molti di questi fattori potrebbero essere simili e quindi l’esame del codice sorgente potrebbe fornire utili informazioni per comprendere meglio il funzionamento dei motori di ricerca e fornire nuovi spunti per gli esperti del settore.

Yandex ha negato che ci sia stata una violazione dei propri sistemi e ha rilasciato una dichiarazione in cui afferma che “il nostro servizio di sicurezza ha trovato frammenti di codice da un repository interno nel dominio pubblico, ma il contenuto differisce dalla versione attuale del repository utilizzato nei servizi Yandex”. Il file dei fattori di classificazione trapelati può essere visionato al seguente link https://webmarketingschool.com/wp-content/uploads/2023/01/factors_gen.txt e anche un’app per navigarli https://yandex-explorer.herokuapp.com/search?q=Click&o=all&s=08

Fattori di Ranking SEO

Gli esperti del settore stanno esaminando attentamente questo documento per comprendere meglio come funzionano i motori di ricerca e acquisire nuovi spunti. Ecco cosa abbiamo compreso:

Il PageRank è stato sottolineato come uno dei fattori di ranking più importanti, con molti esperti che ritengono che funzioni allo stesso modo di quello di Google. Inoltre, è stato confermato che la manipolazione dei clic e il CTR sono fattori di ranking importanti in Yandex.

Inoltre, è emerso che le prestazioni complessive del sito influiscono sulle singole query, con le prestazioni medie di un URL e di un host che sono considerati fattori di ranking importanti.

Tra gli altri fattori pare che la costruzione dell’URL sia un altro fattore di ranking importante per Yandex. Ecco alcuni elementi da tenere in considerazione per ottimizzare l’URL del tuo sito:

  • Evitare di utilizzare troppi slash finali, poiché questi possono essere visti come negativi.
  • Fare attenzione all’utilizzo di numeri nell’URL, poiché questi possono essere visti come negativi.
  • Includere un identificatore GEO (paese o città) corrispondente all’utente nell’URL.
  • Includere la query o una relazione semantica con la query nell’URL.
  • La lunghezza dell’URL sembra essere un fattore di forma, ma non è necessariamente un fattore positivo o negativo. Ad esempio, un fattore di ranking potrebbe essere la divisione della lunghezza dell’URL per 5.

Inoltre, Yandex utilizza la metrica della distanza di Levenshtein per misurare la differenza tra l’URL e la query di ricerca. Per questo motivo, è consigliabile mantenere gli URL semplici e il più possibile incentrati sulla query di ricerca.

Tra gli altri fattori di ranking possiamo individuare anche la previsione del numero di prodotti in una pagina:

  • Yandex utilizza DSSM (Deep Structured Semantic Model) per determinare se una pagina web contiene un prodotto o più prodotti, esaminando l’URL e il titolo della pagina
  • La previsione della probabilità DSSM utilizzando l’URL del documento e il titolo, per determinare la presenza di un solo prodotto nella pagina o di più prodotti.
  • Questo è particolarmente importante per determinare che più prodotti (ad esempio, una tipica pagina di categoria di un eCommerce) sono più adatti e rappresentano una migliore proposta di valore per gli utenti rispetto a una sola pagina di prodotto.

Yandex sfrutta inoltre anche i punteggi di qualità delle pagine:

  • Ci sono molti fattori di ranking che menzionano la qualità della pagina
  • DSSM predice il punteggio di qualità della pagina per un documento
  • Qualità della pagina aggregata dall’host (punteggio medio)
  • L’host svolge un ruolo nella qualità percepita della pagina (supponendo che gli host a basso costo ottengano siti web di spam a basso costo)

Tra le altre considerazioni che possiamo fare notiamo come siano importanti:

  • Affidabilità dell’host
  • Il numero di URL di un dominio che risponde con errori (presumibilmente 5XX e 4XX) è un indicatore di qualità.

Anche i dati di Metrika potrebbero influenzare le classifiche di Yandex

  • I dati trapelati sui fattori di ranking mostrano che i dati di Yandex Metrika hanno un impatto sulle classifiche del motore di ricerca.
  • I fattori di Metrika che influenzano le classifiche includono:
    • Numero di visite a singoli URL
    • Numero di visitatori di singoli URL
    • Tempo medio trascorso dagli utenti sui singoli URL/Pagine
    • e altri dati simili…

Tra gli altri fattori degni di nota possiamo vedere:

  • L’età dei backlink ha un impatto sul posizionamento nei risultati di ricerca.
  • La pertinenza delle query nel testo e nei titoli dei documenti viene valutata tenendo in considerazione i seguenti fattori:
    • Presenza delle parole chiave nel testo e nei titoli SEO
    • Ricorrenza delle parole chiave nelle frasi del testo e della pagina
    • Meta keyword
  • Il motore di ricerca utilizza l’algoritmo BM25 per analizzare il testo. BM25 è una funzione di ranking utilizzata per valutare la rilevanza dei documenti rispetto a una specifica query di ricerca. Si basa sulla struttura di recupero probabilistico  e rappresenta una funzione simile a TF-IDF utilizzata nel reperimento dei documenti.

Infine pare anche che Yandex ADS aiuti il ranking.

Insomma c’è davvero molto da anlizzare e da scoprire per avere spunti molto interessanti lato SEO.

Sicuramente ne parleremo nel nostro corso SEO sempre aggiornato!

Fonte: Twitter, Reddit, LinkedIN