Você sabia que o Google indexa conteúdo em diferentes tipos de armazenamento com base na probabilidade de serem pesquisados/
Gary Illyes, do Google, revela que o índice de busca usa um sistema em camadas onde o conteúdo mais popular é indexado em um armazenamento mais rápido e caro.
Este tópico é discutido no último episódio do podcast Search Off the Record do Google, que trata da complexidade da linguagem na seleção do índice de pesquisa.
Ao explicar como o Google constrói o seu índice de pesquisa, Illyes diz que o conteúdo é indexado em três tipos de armazenamento:
O Google reserva o armazenamento mais rápido para documentos que provavelmente serão exibidos nos resultados de pesquisa com frequência.
Illyes afirma:
E então, quando construímos nosso índice, e usamos todos os sinais que temos. Vamos escolher uma, digamos, classificação de página e, em seguida, tentar estimar o quanto serviríamos aos documentos que indexamos. Então, será como a cada segundo? Teremos uma consulta que acione esses documentos? Ou será uma vez por semana ou uma vez por ano? E com base nisso, podemos usar diferentes tipos de armazenamento para construir o índice.
Illyes continua dando exemplos do que seria armazenado na RAM, o que seria armazenado em SSDs e o que seria armazenado em HDDs.
O conteúdo acessado a cada segundo acabará sendo armazenado na RAM ou SSDs. Isso representa uma pequena quantidade de todo o índice do Google.
A maior parte do índice do Google é armazenado em discos rígidos porque, nas palavras de Illyes, os discos rígidos são baratos, acessíveis e fáceis de substituir.
Então, por exemplo, para documentos que sabemos que podem surgir a cada segundo, por exemplo, eles acabarão em algo super rápido. E o super rápido seria a RAM. Como, parte do nosso índice de serviço está na RAM. Então teremos outro nível, por exemplo, para drives de estado sólido, porque eles são rápidos e não tão caros quanto a RAM. Mas ainda não – a maior parte do índice não estaria nisso. A maior parte do índice estaria em algo que é barato, acessível, facilmente substituível e não quebra o banco. E isso seria discos rígidos ou disquetes.
É claro que Illyes está brincando sobre disquetes, esse é o tipo de humor seco que você recebe dele no podcast :)
Segundo o comentarista do SEJ, Matt Southern está é a primeira vez que o Google abre ao público informações sobre seus níveis de armazenamento de índice de pesquisa. É interessante saber que o conteúdo mais procurado está armazenado em RAM e SSDs.
O custo de armazenar até mesmo uma porcentagem do índice do Google em RAM e SSDs deve ser exorbitante. Embora seja provável que o custo de armazenamento mais rápido seja justificado pela importância dos documentos para as pessoas.
A demanda pelo conteúdo deve ser tão alta que o Google não quer correr o risco de atrasar sua divulgação aos usuários.
No que se refere ao SEO, não há como otimizar um tipo de armazenamento em detrimento do outro. E não há como saber em qual camada de armazenamento o seu site está indexado.
Meu palpite é que uma porcentagem decididamente pequena de páginas da web são indexadas em RAM ou SSDs. Trazendo de volta para o SEO, isso é bom, pois significa que a maioria dos sites está competindo em igualdade de condições quando se trata de velocidade de armazenamento de índice.
Caso queira ler o artigo do Matt na integra, acesse o link abaixo.
Fonte: https://www.searchenginejournal.com/google-uses-faster-storage-for-high-demand-pages/
A gestão de custos é um dos maiores desafios enfrentados pelas empresas, especialmente quando esses…
As startups, impulsionadas por inovação e agilidade, navegam em um cenário digital vibrante, mas também…
A segurança cibernética é crucial para startups, independentemente do seu tamanho ou setor de atuação.…
O gerenciamento de vulnerabilidades é o processo de identificar, avaliar, tratar e relatar vulnerabilidades de…
O DNS Cache Poisoning, ou envenenamento de cache DNS, é uma forma de ataque cibernético…
O DNS hijacking é um ataque malicioso que envolve a alteração das configurações de DNS…