CDN

Google usa armazenamento rápidos para páginas com alta demanda de buscas

Você sabia que o Google indexa conteúdo em diferentes tipos de armazenamento com base na probabilidade de serem pesquisados/

Gary Illyes, do Google, revela que o índice de busca usa um sistema em camadas onde o conteúdo mais popular é indexado em um armazenamento mais rápido e caro.

Este tópico é discutido no último episódio do podcast Search Off the Record do Google, que trata da complexidade da linguagem na seleção do índice de pesquisa.

Ao explicar como o Google constrói o seu índice de pesquisa, Illyes diz que o conteúdo é indexado em três tipos de armazenamento:

  • RAM (memória de acesso aleatório): mais rápida e mais cara
  • SSD (Solid State Drive): Muito rápido, mas com custo proibitivo
  • HDD (unidade de disco rígido): mais lento e menos caro

O Google reserva o armazenamento mais rápido para documentos que provavelmente serão exibidos nos resultados de pesquisa com frequência.

Illyes afirma:

E então, quando construímos nosso índice, e usamos todos os sinais que temos. Vamos escolher uma, digamos, classificação de página e, em seguida, tentar estimar o quanto serviríamos aos documentos que indexamos. Então, será como a cada segundo? Teremos uma consulta que acione esses documentos? Ou será uma vez por semana ou uma vez por ano? E com base nisso, podemos usar diferentes tipos de armazenamento para construir o índice.

Illyes continua dando exemplos do que seria armazenado na RAM, o que seria armazenado em SSDs e o que seria armazenado em HDDs.

O conteúdo acessado a cada segundo acabará sendo armazenado na RAM ou SSDs. Isso representa uma pequena quantidade de todo o índice do Google.

A maior parte do índice do Google é armazenado em discos rígidos porque, nas palavras de Illyes, os discos rígidos são baratos, acessíveis e fáceis de substituir.

Então, por exemplo, para documentos que sabemos que podem surgir a cada segundo, por exemplo, eles acabarão em algo super rápido. E o super rápido seria a RAM. Como, parte do nosso índice de serviço está na RAM. Então teremos outro nível, por exemplo, para drives de estado sólido, porque eles são rápidos e não tão caros quanto a RAM. Mas ainda não – a maior parte do índice não estaria nisso. A maior parte do índice estaria em algo que é barato, acessível, facilmente substituível e não quebra o banco. E isso seria discos rígidos ou disquetes.

É claro que Illyes está brincando sobre disquetes, esse é o tipo de humor seco que você recebe dele no podcast :)

Segundo o comentarista do SEJ, Matt Southern está é a primeira vez que o Google abre ao público informações sobre seus níveis de armazenamento de índice de pesquisa. É interessante saber que o conteúdo mais procurado está armazenado em RAM e SSDs.

O custo de armazenar até mesmo uma porcentagem do índice do Google em RAM e SSDs deve ser exorbitante. Embora seja provável que o custo de armazenamento mais rápido seja justificado pela importância dos documentos para as pessoas.

A demanda pelo conteúdo deve ser tão alta que o Google não quer correr o risco de atrasar sua divulgação aos usuários.

No que se refere ao SEO, não há como otimizar um tipo de armazenamento em detrimento do outro. E não há como saber em qual camada de armazenamento o seu site está indexado.

Meu palpite é que uma porcentagem decididamente pequena de páginas da web são indexadas em RAM ou SSDs. Trazendo de volta para o SEO, isso é bom, pois significa que a maioria dos sites está competindo em igualdade de condições quando se trata de velocidade de armazenamento de índice.

Caso queira ler o artigo do Matt na integra, acesse o link abaixo.

Fonte: https://www.searchenginejournal.com/google-uses-faster-storage-for-high-demand-pages/
Go Cache

Share
Publicado por
Go Cache

Publicações recentes

Como Reduzir Custos em um Cenário de Alta do Dólar

A gestão de custos é um dos maiores desafios enfrentados pelas empresas, especialmente quando esses…

4 months atrás

Ameaças Comuns de Segurança para Startups

As startups, impulsionadas por inovação e agilidade, navegam em um cenário digital vibrante, mas também…

6 months atrás

A Importância da Segurança Cibernética em Startups

A segurança cibernética é crucial para startups, independentemente do seu tamanho ou setor de atuação.…

7 months atrás

O que é Gerenciamento de Vulnerabilidades?

O gerenciamento de vulnerabilidades é o processo de identificar, avaliar, tratar e relatar vulnerabilidades de…

8 months atrás

DNS Cache Poisoning: Entendendo a ameaça cibernética e suas consequências

O DNS Cache Poisoning, ou envenenamento de cache DNS, é uma forma de ataque cibernético…

8 months atrás

DNS Hijacking: Entendendo a Ameaça

O DNS hijacking é um ataque malicioso que envolve a alteração das configurações de DNS…

8 months atrás