mboost-dp1

Hvad cacher Google?


Gå til bund
Gravatar #1 - BjarniM
5. feb. 2012 11:39
Findes der ikke et sted på nettet, hvor man kan tjekke, hvad Google har cachet af ens hjemmeside, eller måske nærmere defineret en bestemt artikel, som man har publiceret?
Gravatar #2 - reefermadness  
5. feb. 2012 12:09
du kan lave cache: søgninger på urls i google, er der en cached version, så dukker den op.

f.eks:

cache:google.dk
Gravatar #3 - BjarniM
5. feb. 2012 12:29
Ok, men er cache det samme som indeksering i disse tilfælder?

Årsagen, til at jeg også spørger er, fordi jeg har prøvet at slå nogle URL'er op, og det tilsyneladende ser ud til, at Google har cachet hele indholdet af det indhold, som jeg har prøvet at slå op.

Jeg mente ellers, at Google kun cachede x antal bogstaver af en overskrift, x antal bogstaver af en underoverskrift og kun en del af selve indholdet i en artikel?
Gravatar #4 - reefermadness  
5. feb. 2012 12:38
Er ikke helt med...

Ved ikke om det du kan se i cache er det samme "indeks" som google søger i.

Forstår ikke helt det med at google kun indekserer dele af en artikel? Er nu rimelig sikker på at alt tekst på en side, kan søges på via google..
Gravatar #5 - BjarniM
5. feb. 2012 12:44
#4:

Ok. Jeg hørte ellers en gang, at Google "kun" indekserer et vist antal af f.eks. en artikel og ikke hele indholdet, men så er dette måske forandret.
Gravatar #6 - reefermadness  
5. feb. 2012 12:56
kan da godt tænkes at meget store html filer kun bliver gemt delvis, men det er ren spekulation..

Det er nok ret sikkert at f.eks skjult tekst er ekskluderet fra indekseringen (f.eks hvid tekst på hvid baggrund, nok også display:none elementer, skal dog siges at jeg har set display:none blive indekseret)

Selve rangeringen af resultaterne er lidt af en hemmelighed, men som udgangspunkt kan du følge google's webmaster guidelines :

http://support.google.com/webmasters/bin/answer.py...

og ellers suge hvad du kan af viden fra google's youtube feed:

http://www.youtube.com/user/GoogleWebmasterHelp

(Selvom videoerne tit har et ret tvetydigt svar, men der er gode pointers til best practice, og der bliver debunked en del myter om google SEO)
Gravatar #7 - kasperd
5. feb. 2012 13:03
BjarniM (1) skrev:
Findes der ikke et sted på nettet, hvor man kan tjekke, hvad Google har cachet af ens hjemmeside, eller måske nærmere defineret en bestemt artikel, som man har publiceret?
Du kan f.eks. bruge en site: søgning til at finde ud af hvilke sider fra sitet som liger i Googles indeks. Hvis det er et meget stort site kan du dog ikke få alle URLer at se på den måde. Jeg tror kun den vil vise de første 1000 eller deromkring.

Bemærk at dette kun fortæller hvad der er i indekset, det er ikke nødvendigvis det samme som hvad der er crawlet. Både crawler og indeksering forsøger at gå efter de væsentligste sider, men de har ikke adgang til præcist de samme data og kan derfor træffe forskellige valg.

En side kan være udeladt af crawleren pga. robots.txt, et site der har så mange sider at webserveren ikke kan følge med, hvis Google prøver at crawle dem alle, eller at crawleren ikke vurderede at den var vigtig. Hvis den er udeladt pga. en af ovenstående grunde vil den kunne findes ved en søgning, men du vil åbenlyst kun se URLen og intet af sidens indhold.

En side kan også være blevet crawlet men udeladt fra indekset. Det kan enten skyldes at indekseringen ikke vurderer siden som vigtig eller at meta tags på siden ikke tillader indeksering. Meta tags kan fravælge indeksering og cache uafhængigt af hinanden.

Jeg ved ikke om Google har forskellige algoritmer til at vælge hvilke sider der er i indekset og hvilke der vises som cachet. Man kunne godt forestille sig en side der var vigtig nok til indekset men ikke vigtig nok til cache, eller omvendt. Men jeg ved ikke om det forekommer. Til gengæld bliver indeks og cache ikke opdateret samtidigt. Hvis siden er blevet ændret for nyligt kan der altså være forskel på hvad der søges i og hvad der vises som cachet.

Hvis du vil have forskellige oplysninger om en specifik URL kan du bruge en info: søgning.

Jeg kan også anbefale at du prøver Google Webmaster Tools, de kan give svar på en del spørgsmål.

BjarniM (3) skrev:
Jeg mente ellers, at Google kun cachede x antal bogstaver af en overskrift, x antal bogstaver af en underoverskrift og kun en del af selve indholdet i en artikel?
Enten er siden cachet eller også er den ikke. Der er godt nok en grænse for hvor store sider Google vil lægge i cachen, men den grænse er meget høj. Hvis du har sider, der når over den grænse, så gør du noget galt.
Gå til top

Opret dig som bruger i dag

Det er gratis, og du binder dig ikke til noget.

Når du er oprettet som bruger, får du adgang til en lang række af sidens andre muligheder, såsom at udforme siden efter eget ønske og deltage i diskussionerne.

Opret Bruger Login