Söndagsfunderingar

En sån här apparat från schwiziska 4DigitalBooks digitaliserar 1000-3000 sidor i timmen.
Kevin Kellys artikel i dagens New York Times om drömmen om att digitalisera världens alla böcker och göra dem sökbara med hjälp av dagens sökmotorsteknik är intressant - "Scan This Book!" (om än ganska otypiskt för att vara en NYT Magazine-artikel, då de brukar vara ganska väl underbyggda med intervjuer och citat; här är det mest Kellys funderingar som kommer fram). Men jag har lite svårt att förstå vad han menar i ett sånt här stycke:
The link and the tag may be two of the most important inventions of the last 50 years. They get their initial wave of power when we first code them into bits of text, but their real transformative energies fire up as ordinary users click on them in the course of everyday Web surfing, unaware that each humdrum click 'votes' on a link, elevating its rank of relevance. You may think you are just browsing, casually inspecting this paragraph or that page, but in fact you are anonymously marking up the Web with bread crumbs of attention. These bits of interest are gathered and analyzed by search engines in order to strengthen the relationship between the end points of every link and the connections suggested by each tag. This is a type of intelligence common on the Web, but previously foreign to the world of books.
Det verkar vara ett rätt seriöst missförstånd av vad sökmotorer gör när de rankar resultat, men han kanske menar något annat (om han pratar om annonser är det ju en helt annan sak). Relevans rankas ju snarare av något mycket mer aktivt, nämligen länkandet, och inte det passiva klickandet. Och det är ju i detta som styrkan hos bl.a Google har legat, att räkna ut auktoritet och relevans utifrån nätverk av länkar, men hur ska detta sättas i verket när man ska ranka sökresultat i de gigantiska olänkade textmassor som det "universella biblioteket" utgör (bl.a. Google Book Search), om överhuvud taget. Frågan är vad som kommer att utgöra de atomära delarna i detta "bokuniversum" - verket, sidan, meningen - och som därmed blir "addresserbart". Vad blir "permalänkar" i det digitala biblioteket? En fundering bara.
Man märker tydligt hur svårt det blir med relevansen när t.ex. Google försöker efterlikna den mer strikta citeringslogiken från akademiska databaser som Science Citation Index i Google Scholar - visst, det gör träffresultaten användbara, men ingen vågar ta de faktiska siffrorna för citeringar (hur många gånger en artikel har citerats av andra artiklar) på allvar eftersom man inte vet vad som ingår i uträkningen. En fundering till bara.
I fallet "boksök" skulle relevansen förmodligen förbättras om man byggde in faktorer som tog med användarnas aktivitet - det må vara personliga taggar, noteringar (se Google Notebook som kommer i veckan), inkommande länkar (från Blogger bl.a.) och andra former av "kollaborativ kvalificering" (nytt begrepp! se Google Co-op), medan Scholar skulle behöva styras upp och tydliggöras för att bli användbart i den akademiska världen.
Update: läs gärna Nicholas Carrs invändningar mot de mer utopiska aspekterna i Kellys artikel:
He does a great job of describing a utopian orgy of communal surf-reading, but he provides no evidence that this orgy will either happen as he describes it or, if it does, that it will make us smarter or wiser or otherwise better, either individually or as a society....och det obligatoriska bland kommentarerna:
I wonder whether the ideology of social 2.0 collaboration is to the 21st century what the ideology of communism was to the 20th century.
Update 2: Michael McGrorty hos Library Dust har en lång och intressant reflektion kring hur detta påverkar bibliotekarie-professionen. Mer fokus på innehåll och mindre på form (vare sig det är "boken" eller något digitalt) menar han är lösningen/räddningen:
The library will continue in some form. Whether the librarian will go along will not depend upon how fast she can run to catch up with changes in format or presentation, but how well and thoroughly she remains committed to the essence of the place, to its foundation in learning and culture.
Relaterat:
» Apropå Kevin Kelly, så kommer han till konferensen The Next Web, som äger rum i Amsterdam 7 juli, där också Michael Arrington från TechCrunch och Kevin Rose från Digg deltar. Syftet verkar vara att presentera europeiska Web 2.0-tjänster, som t.ex. Netvibes, Plazes, AllPeers och Hyves.net.
» Apropå Google, så har veckans The Economist ännu en special - "Fuzzy maths". Huvudidéen är att Google håller på att bli Microsoft.
» Inside Google Book Search kan man ju läsa.

Kommentarer
"Relevans rankas ju snarare av något mycket mer aktivt, nämligen länkandet, och inte det passiva klickandet."
google pekar inte alltid direkt på resultatsajten. ibland redirectar dom via sin egen sajt, vilket tyder på att dom åtminstone till viss utsträckning använder "passivt klickande" för olika saker.
Postad av: Fredrik | maj 14, 2006 7:40 EM
Det har du rätt i. Men huruvida man använder detta för rankning är väl rätt oklart? Jag kan dock tänka mig att man använder det för personalisering av sökresultat, men det är ju något helt annat.
(Ser att dikotomin mellan "aktivt länkande" och passivt klickande" ju egentligen inte håller, med tanke på dels länkfarmar m.m., och att "klickande" ju faktiskt är något högst aktivt).
Postad av: Erik | maj 14, 2006 7:51 EM
En annan sak som Carr vänder sig mot är att han tycker Kelly beskriver bokens historia lite felaktigt; läsande och skrivande var aldrig en så solitär verksamhet som Kelly (enligt Carr) vill göra gällande.
Postad av: Gustav | maj 14, 2006 9:30 EM
...och han har ju helt rätt, Carr alltså. Läsande och skrivande är ju en social aktivitet i allra högsta grad, och frågan är om inte det Kelly beskriver egentligen handlar om att föra över de naturliga sociala relationer som växt fram kring "bokväsendet" till en digital värld, som i mångt och mycket är bra mycket mer solitär.
Postad av: Erik | maj 14, 2006 9:59 EM
Jag tycker också Carr har rätt på den punkten.
Sen tycker jag Carr kunde tagit upp bokens beständighet; man köper en bok på antikvariat och där finns, 100 år senare, marginalanteckningar, understrykningar, ditklottrade referenser till andra böcker. Böcker och de sociala vävar som böckerna, boksamlingarna och de andra artefakterna i bokvärlden bär upp har ett slags stryktålighet som jag tycker är coolt och som ibland webben saknar.
Postad av: Gustav | maj 14, 2006 11:07 EM