I Google Leak sono dei documenti che si dicono provenire dall’archivio interno di Google condivisi agli inizi di maggio 2024 da Erfan Azimi su Githhub . Si tratta di circa 2.500 pagine di documenti che descrivono dettagli tecnici relativi al funzionamento dell’algoritmo di Google che offrono una visione allargata dei meccanismi interni della ricerca di Google.

Google è storicamente molto attenta a proteggere il segreto del suo algoritmo e della ricerca e ha confermato la fuga di documenti ma ha voluto attraverso un suo portavoce: “mettere in guardia dal fare supposizioni inaccurate su come funziona Search basate su informazioni decontestualizzate, obsolete o incomplete “.

Ecco un elenco degli elementi che deteminano il Search di Google secondo i Google Leak di Maggio 2024

  • 1. Site Authority: metrica che misura l’autorità complessiva di un sito web
  • 2. Click Data: dati come “goodClicks” e “badClicks” per valutare la qualità delle interazioni degli utenti
  • 3. NavBoost: Sistema che migliora il ranking basandosi su dati di navigazione degli utenti
  • 4. Human Raters: i documenti realizzati da valutatori umani possono ricevere un peso maggiore nei risultati di ricerca
  • 5. Sandbox: Meccanismo che limita il ranking dei nuovi siti web per prevenire manipolazioni e spam
  • 6. PageRank: Valuta l’importanza di una pagina web basandosi sui link entranti
  • 7. Freshness: Importanza dei contenuti aggiornati e freschi, valutando la data di pubblicazione e le modifiche recenti per mantenere i risultati rilevanti
  • 8. Brand Signals: Segnali legati alla notorietà del brand offline e online, influenzando il ranking e la fiducia degli utenti
  • 9. User Experience: desperienza utente come velocità del sito, compatibilità mobile e interattività
  • 10. Content Type Specificity: Google assegna un trattamento speciale a determinati tipi di contenuti durante eventi critici come elezioni e pandemie
  • 11. Truncation and Length Scores: Google valuta la lunghezza dei documenti, con punteggi basati sull’originalità del contenuto, ma  documenti troppo lunghi possono essere tranciati
  • 12.YMYL (Your Money Your Life) Content Scores: Contenuti critici come salute e finanza ricevono un punteggio specifico
  • 13. TitlematchScore: Valuta quanto il titolo di una pagina corrisponde alla ricerca dell’utente
  • 14. Average Term Weight: Misura il peso medio delle parole chiave nei documenti e nei testi di ancoraggio,
  • 15. RegistrationInfo: le informazioni di registrazione del dominio per valutarne la legittimità e affidabilità
  • 16. Vectorization and Embeddings: Utilizza la vettorizzazione per confrontare pagine e siti web con altre pagine simili
  • 17. Syntactic and Semantic Dates: Analizza le diverse date associate ai contenuti per determinarne la freschezza,
  • 18. Whitelisting: Certi domini ricevono un trattamento speciale, come quelli relativi a elezioni e COVID-19
  • 19. ChromeInTotal:  Google utilizza dati dal browser Chrome per valutare il comportamento degli utenti
  • 20. SmallPersonalSite:  Indica un trattamento specifico per piccoli siti personali o blog
  • 21. Golden Document Flag: Documenti etichettati manualmente da valutatori umani ricevono un peso maggiore nel ranking
  • 22. Link Diversity: La diversità e la rilevanza dei link sono importanti per il ranking, esaltando l’importanza dei link di qualità
  • 23. Font Size Weight: Misura la media ponderata dei termini nei documenti per valutare l’importanza delle parole chiave
  • 24. Successful Clicks:  “lastLongestClicks” e “unsquashedClicks” per determinare il valore delle interazioni utente
  • 25. Core Topic Relevance: Valutazione della la pertinenza dei documenti ai temi principali del sito
  • 26. Neural Search: Algoritmo che modifica il PageRank basato su lettura e comprensione dei documenti
  • 27. Page Quality : Stima l’impegno richiesto per una pagina, migliorando la qualità dei risultati
  • 28. SiteFocusScore: Identifica quanto un sito è focalizzato su un argomento specifico
  • 29. SiteRadius: Misura la distanza tra i PageEmbeddings e i SiteEmbeddings
  • 30. Hosting Quality : Valutano l’ottimizzazione del servizio hosting, misurando la velocità e affidabilità del sito
  • 31. IsElectionAuthority: siti con autorità indiscussa in determinati settori
  • 32. Proximity Targeting: targeting di prossimità, migliorando la rilevanza locale dei risultati
  • 33. Page Embeddings:  embedding per oggetti in un formato comprensibile dai computer,
  • 34. Unicorn Clicks: Misura i clic rari o unici per valutare la qualità del contenuto
  • 35. Glue:  altre caratteristiche della pagina
  • 36. Sitelinks: Utilizza il numero di clic su pagine nei browser Chrome per determinare gli URL più importanti su un sito
  • 37. Ewok Ratings: Valutazioni di qualità da parte di revisori umani che possono influenzare il ranking

Google News  Ricevi le nostre ultime notizie da Google News - SEGUICI

Iscriviti alla nostra newsletter per essere aggiornato sulle nostre attività e sul nostro sito
.
Seguici su Facebook , Twitter , Linkedin.