Oggi, stiamo annunciando il completamento di un nuovo sistema di indicizzazione web chiamato Caffeine.
Caffeine fornisce i risultati più freschi del 50 per cento per le ricerche web dell’ultimo indice, ed è la più grande collezione di contenuti web che abbiamo mai offerto. Che si tratti di una notizia, un blog o un post sul forum, ora potete trovare i link a contenuti pertinenti molto prima di quanto fosse possibile in passato dopo la loro pubblicazione.
Per spiegare ad alcuni di voi che non costruiscono i motori di ricerca da una vita come lo facciamo noi: quando state eseguendo una ricerca su Google, non è la ricerca sul Web dal vivo. Si stava cercando di proporre l’indice di Google come un elenco in fondo al libro, vi aiutava a individuare esattamente le informazioni desiderate.
Quindi, perché quella costruzione di un nuovo sistema di indicizzazione?
Contenuto sul web sta fiorendo. Non è in crescita solo in termini di dimensioni e numeri, ma con l’avvento del video, immagini, notizie e aggiornamenti in tempo reale, mediamente la pagina web è più ricca e più complessa. Inoltre, oggigiorno le aspettative della gente per la ricerca sono superiori a quelle di una volta. Ricercatori vogliono trovare i contenuti più recenti e più rilevanti, e gli editori si aspettano di trovare sulle serp un attimo dopo aver pubblicato.
Ecco perche abbiamo costruito Coffeine, per stare al passo con l’evoluzione del web e per soddisfare le crescenti aspettative degli utenti.
Il nostro vecchio indice ha diversi strati, alcuni dei quali sono stati aggiornati a un ritmo più veloce di altri, lo strato principale andava aggiornato ogni due settimane. Per aggiornare un livello più vecchio dell’indice, dovevamo analizzare tutto il Web, il che significava un notevole ritardo tra il momento di trovare la pagina e renderla disponibile.
Con Caffeine invece, i contenuti presenti sul Web vengono suddivisi in piccole porzioni che vengono analizzate di continuo. Quando vengono scoperte nuove pagine, esse vengono aggiunte direttamente all’indice, in modo da renderle subito disponibili agli utenti.
Ogni secondo Caffeine analizza centinaia di migliaia di pagine contemporaneamente e quotidianamente vengono aggiunti centinaia di migliaia di Gb al suo database. Questo significa che potete trovare informazioni più fresche che mai, non importa quando o dove sono state pubblicato.
Caffeine ci permette di indicizzare le pagine web su una scala enorme. In effetti, Caffeina scansiona centinaia di migliaia di pagine in parallelo. Se questo fosse un mucchio di carta sarebbe cresciuto di tre milioni di pagine ogni secondo. Caffeine occupa quasi 100 milioni di gigabyte di memoria in un unico database e aggiunge nuove informazioni a una velocità di centinaia di migliaia di gigabyte al giorno. Caffeina avrebbe bisogno di 625.000 dei più grandi iPod per memorizzare tutte le informazioni accatastate end-to-end (di continuo)
Caffeine però non è un punto di arrivo, ma è la base sulla quale Google intende costruire il prossimo futuro della ricerca sul Web.
Quindi rimanete sintonizzati, e cercare ulteriori miglioramenti nei mesi a venire.
Fonte: googleblog.blogspot.com
Approfondimenti...
Domani, primo marzo, diventano operative le modifiche annunciate da Google alla normativa sulla privacy dei suoi servizi. Consideratala grande...
Ricerche in più rapida ascesa 1. Simoncelli 2. Danza Kuduro 3. iPhone 5 4. Groupon 5. Referendum 6. Na Pohybel Janas 7. Censimento 2011 8. iPad 2...
Dopo 12 settimane di Beta test, Google + è realtà e sarà aperto a tutti. Il monopolio di Facebook, con unico concorrente valido Twitter rischia di essere...
Nel 2005 è stato effettuato uno studio sui livelli di residui di droga nelle acque del Po. Si è concluso che nel più grande fiume italiano, scorrono ogni...
Non siete mai stati a Taos, Nuovo Messico? Ve lo consiglio. È un paesino nel nord del Nuovo Messico, negli USA, ai piedi della catena montuosa Sangre de...
