I Google Leak sono dei documenti che si dicono provenire dall’archivio interno di Google condivisi agli inizi di maggio 2024 da Erfan Azimi su Githhub . Si tratta di circa 2.500 pagine di documenti che descrivono dettagli tecnici relativi al funzionamento dell’algoritmo di Google che offrono una visione allargata dei meccanismi interni della ricerca di Google.
Google è storicamente molto attenta a proteggere il segreto del suo algoritmo e della ricerca e ha confermato la fuga di documenti ma ha voluto attraverso un suo portavoce: “mettere in guardia dal fare supposizioni inaccurate su come funziona Search basate su informazioni decontestualizzate, obsolete o incomplete “.
Ecco un elenco degli elementi che deteminano il Search di Google secondo i Google Leak di Maggio 2024
- 1. Site Authority: metrica che misura l’autorità complessiva di un sito web
- 2. Click Data: dati come “goodClicks” e “badClicks” per valutare la qualità delle interazioni degli utenti
- 3. NavBoost: Sistema che migliora il ranking basandosi su dati di navigazione degli utenti
- 4. Human Raters: i documenti realizzati da valutatori umani possono ricevere un peso maggiore nei risultati di ricerca
- 5. Sandbox: Meccanismo che limita il ranking dei nuovi siti web per prevenire manipolazioni e spam
- 6. PageRank: Valuta l’importanza di una pagina web basandosi sui link entranti
- 7. Freshness: Importanza dei contenuti aggiornati e freschi, valutando la data di pubblicazione e le modifiche recenti per mantenere i risultati rilevanti
- 8. Brand Signals: Segnali legati alla notorietà del brand offline e online, influenzando il ranking e la fiducia degli utenti
- 9. User Experience: desperienza utente come velocità del sito, compatibilità mobile e interattività
- 10. Content Type Specificity: Google assegna un trattamento speciale a determinati tipi di contenuti durante eventi critici come elezioni e pandemie
- 11. Truncation and Length Scores: Google valuta la lunghezza dei documenti, con punteggi basati sull’originalità del contenuto, ma documenti troppo lunghi possono essere tranciati
- 12.YMYL (Your Money Your Life) Content Scores: Contenuti critici come salute e finanza ricevono un punteggio specifico
- 13. TitlematchScore: Valuta quanto il titolo di una pagina corrisponde alla ricerca dell’utente
- 14. Average Term Weight: Misura il peso medio delle parole chiave nei documenti e nei testi di ancoraggio,
- 15. RegistrationInfo: le informazioni di registrazione del dominio per valutarne la legittimità e affidabilità
- 16. Vectorization and Embeddings: Utilizza la vettorizzazione per confrontare pagine e siti web con altre pagine simili
- 17. Syntactic and Semantic Dates: Analizza le diverse date associate ai contenuti per determinarne la freschezza,
- 18. Whitelisting: Certi domini ricevono un trattamento speciale, come quelli relativi a elezioni e COVID-19
- 19. ChromeInTotal: Google utilizza dati dal browser Chrome per valutare il comportamento degli utenti
- 20. SmallPersonalSite: Indica un trattamento specifico per piccoli siti personali o blog
- 21. Golden Document Flag: Documenti etichettati manualmente da valutatori umani ricevono un peso maggiore nel ranking
- 22. Link Diversity: La diversità e la rilevanza dei link sono importanti per il ranking, esaltando l’importanza dei link di qualità
- 23. Font Size Weight: Misura la media ponderata dei termini nei documenti per valutare l’importanza delle parole chiave
- 24. Successful Clicks: “lastLongestClicks” e “unsquashedClicks” per determinare il valore delle interazioni utente
- 25. Core Topic Relevance: Valutazione della la pertinenza dei documenti ai temi principali del sito
- 26. Neural Search: Algoritmo che modifica il PageRank basato su lettura e comprensione dei documenti
- 27. Page Quality : Stima l’impegno richiesto per una pagina, migliorando la qualità dei risultati
- 28. SiteFocusScore: Identifica quanto un sito è focalizzato su un argomento specifico
- 29. SiteRadius: Misura la distanza tra i PageEmbeddings e i SiteEmbeddings
- 30. Hosting Quality : Valutano l’ottimizzazione del servizio hosting, misurando la velocità e affidabilità del sito
- 31. IsElectionAuthority: siti con autorità indiscussa in determinati settori
- 32. Proximity Targeting: targeting di prossimità, migliorando la rilevanza locale dei risultati
- 33. Page Embeddings: embedding per oggetti in un formato comprensibile dai computer,
- 34. Unicorn Clicks: Misura i clic rari o unici per valutare la qualità del contenuto
- 35. Glue: altre caratteristiche della pagina
- 36. Sitelinks: Utilizza il numero di clic su pagine nei browser Chrome per determinare gli URL più importanti su un sito
- 37. Ewok Ratings: Valutazioni di qualità da parte di revisori umani che possono influenzare il ranking
Iscriviti alla nostra newsletter per essere aggiornato sulle nostre attività e sul nostro sito
.
Seguici su Facebook , Twitter , Linkedin.