Nye semantiske bindinger

Zooka har nu fået tilføjet en emne sektion. Den kan fungere som en slags nedbryder mod hvad du søger på – kan styres via indstillingerne - eller den kan sende dig rundt til ord/sætninger du ikke havde troet var forbundet med netop din søgning.

Data er ved skrivende stund på vej ind i hobetal, så der kan gå lidt tid før en søgning kan aktiverer emnerne. Alle bindinger er noget Nettet selv styre, så det bliver rigtig spændene hvad der kommer til at vise sig her.

Det er ikke bare på første side på en søgning den er aktiv, jeg har set den ændre sig bare man gik til side 2,3,4 osv.

Encoding mareridt
Encoding er blevet meget bedre. Det var rimeligt nemt at få lokaliseret synderen, og så få tæmmet banditten var en ganske anden sag.

Her er en list over hvad de forskellige xml feeds benytter sig af:

default   452370 - Ikke gennemsøgt  
utf-8   69955  
iso-8859-1   9983  
utf-7   129  
iso-8859-9   31  
iso-8859-15   22  
koi8-r   1  
us-ascii   1  

Udfordringen består nu i at få ryddet op i alt det der er indsat med forkert encoding.

Harware opdatering
F.eks. kom den nye Router, men! – de nuværende switches laver lidt ballade her, så 2 nye switches skal lige købes ind får jeg går i gang med dét, desværre. Jeg bliver nød til denne operation da bla. andre Bots m.v. hygger sig gevaldigt på webserveren. Specielt GoogleBot giver den rigeligt med gas.

Til slut
Så ved jeg godt at jeg lovede at skrive om server setup m.v. – det må lige vente lidt, har ret meget på programmet der absolut må komme først. Bla. er jeg ved at drukne i duplikater af indhold. Der er f.eks. en hjemmeside der udgiver sit feed med en GUID i navnet der ændrer sig ved hvert besøg, men indholdet er 100% identisk. Og spørger man på den gamle Feed Url får man fint svar med indhold og det hele. Derfor indledes der snart en operation ”BigDaddy” i Zooka regi..

Tags:
Categories: Beretninger | Zooka

| Comments (1)

Comments

Comments are closed