10/14/06

Kijk, de olifant beweegt

Het was vrijdag de dertiende en Google zal het weten. Op een en dezelfde dag maken de krantenuitgevers in de wereld bekend dat ze iets denken te hebben gevonden op het parasitaire gedrag van nieuwsbots, en kondigen Amerikaanse mediabedrijven aan dat ze juridische stappen gaan zetten tegen de piraterij op YouTube. De olifant beweegt.

YouTube wordt voor 1,2 miljard dollar overgenomen door Google, dat zich daarmee nog wat meer in de nesten werkt. De videosite is enorm succesvol, maar wordt ook misbruikt voor videomateriaal dat gewoon gejat is. Daar kan je van vinden wat je wilt, feit is dat de eigenaren niet van plan zijn het door de vingers te blijven zien.

Volgens The Wall Street Journal hebben juristen van onder meer News Corp., NBC Universal en Viacom berekend dat YouTube per illegaal filmje 150.000 dollar moet betalen. Viacom schat dat video’s van zijn MTV en Nickelodeon dagelijks 80.000 keer worden bekeken op YouTube. De schade zou dan oplopen tot miljarden dollars.

Juridisch veel ingewikkelder ligt het bij Google News en soortgelijke aggregatoren van het nieuws. Koppen snellen en een paar regels lenen wordt nog nergens gezien als onrechtmatig gebruik van de content van derden. De wetgeving in de VS – met beginselen als fair use en implied license – staat net als de wetgeving in Europa – die meer op het Nederlandse auteursrecht lijkt – vrij veel toe.

De krantenuitgevers zijn gisteren in Frankfurt aan hun offensief begonnen met ACAP, automated content access protocol. ACAP wordt, begrijp ik uit het persbericht waarmee een pilot wordt aangekondigd, zoiets als robot.txt, dat verhindert dat een site door een spider wordt gezien en dus doorzoekbaar wordt. Alleen is ACAP slimmer.

Volgens de World Association of Newspapers, de WAN, mede-initiatiefnemer, moet ACAP het mogelijk maken dat je 1. als site sommige spiders wel en andere niet toelaat, en 2. niet heel je site laat indexeren maar slechts delen die je zelf benoemt.

Beide is op het eerste gezicht slim. De zoekmachine die de WAN het meest ter wille is, krijgt de meeste rechten en zal daarmee het meest interessant worden voor consumenten, omdat die zoekmachine meer links naar nieuws bevat dan andere.

Vraag is natuurlijk of het werkt. Kan ACAP verhinderen dat Google – want dat is nu eenmaal de grootste boosaard – niettemin naar binnen glipt? Waarschijnlijker is het dat ACAP vooruit loopt op nieuwe wetgeving. Het geeft immers nieuwe praktische mogelijkheden om een tot een interpretatie te komen van fair use, waarin krantenuitgevers zich ook kunnen vinden.

09/28/06

Zijn die Belgen gek geworden?

Zijn de Belgen gek geworden? Als er 45 jongeren worden aangehouden bij rellen in de Brusselse Marollenwijk, verwijst ‘s werelds grootste zoekmachine op internet naar het AD, de NOS, RTL Nieuws en Elsevier. En dat premier Verhofstadt een crisisje bezweert, lezen we via BN De Stem, BNR Nieuwsradio en warempel ook een Brussels weblog over politiek. Alle andere kranten, van De Standaard tot aan Le Soir, doen bij Google Nieuws niet meer mee.
Lees verder

06/25/06

Zo veel hype en toch zo weinig omzet

Gegeven alle moeite die traditionele uitgevers zich getroosten om iets van internet te begrijpen, is het verbazingwekkend hoe weinig ze aan het nieuwe medium verdienen, schrijft Richard Siklos in The New York Times. Het enthousiasme en de hype zijn omgekeerd evenredig aan hun omzetten, luidt de nuchtere conclusie.

Het uitblijven van eclatante successen is des te opvallender omdat het internet de afgelopen tien jaar de maatschappij behoorlijk overhoop heeft gehaald. Zo goed als we ons niet kunnen voorstellen dat er een tijd is geweest zonder gsm (je had vaste telefoons), zonder prijsvechtende luchtvaartmaatschappijen (je betaalde een vermogen) en zonder cd’s (ach god, de lp), zo ondenkbaar is nu ook een leven zonder internet.

Volgens The New York Times verwachten grote uitgevers wel meer te zullen gaan verdienen aan het net, maar worden hun omzetten nu nog afgeroomd door aggregators, websites als Google News die parasiteren op de originele content van gewone uitgevers.

Wat mij wel fascineert is dat deze dubbele boodschap (“We verdienen er nu nog niet aan, maar het komt wel goed”) al zo lang wordt herhaald als het internet bestaat. Ondertussen wordt het echt geld verdiend door pure players als Amazon, eBay en Google. Soms denk ik: traditionele media zitten te wachten op iets wat nooit gaat gebeuren.

06/9/06

Nooit zal er een open source Google zijn

Toen Eric Schmidt, ceo van Google, de zoekmachine die ‘don’t be evil’ als motto hanteert, werd gevraagd wat ze in Mountain View precies verstonden onder ‘evil’, verwees hij naar Sergey Brin, die het bedrijf samen met Larry Page in 1998 stichtte. ‘Het kwaad is’, zei Schmidt, ‘wat Sergey zegt dat het kwaad is.’

Als Brin deze week volgens berichten in de media toegeeft dat het achteraf bezien niet verstandig was om te dealen met China, en zoektermen als Falun Gong of de namen van in ongenade gevallen leiders af te sluiten, dan betekent dat iets. Dan buigt Google, ofwel voor zijn eigen motto, ofwel voor druk van onderaf, van gebruikers.

Op dat laatste houdt Geert-Jan Bogaerts het, internetchef van de Volkskrant. In zijn column vandaag gaat hij een stap verder. Het wordt tijd, schrijft hij, dat er een minder kwaadaardig alternatief voor Google komt. Het wordt tijd voor een open source zoekmachine.

Nou zijn die er al jaren. Zie dit overzicht, bijvoorbeeld. Er is zelfs een tamelijk veel geprezen open source zoekmachine, genaamd Nutch. John Battelle, de ex-Wired-journalist en auteur van een boek over Google, verwachtte in 2003 dat Nutch de regels van het spel qua zoeken ging herschrijven.

Nutch wordt (of werd) gesteund door de spraakmakende gemeente van open source. Mitch Kapor, miljonair en oprichter van Lotus, maar ook uitgever Tim O’Reilly (de man die de term web 2.0 uitnutte) en Brewster Kahle, miljonair en idealist, staan achter het zoekproject.

En toch, zeggen kennissen van mij met meer verstand van zoekmachines en open source, zal het niet lukken. Omdat er meer nodig is voor een Google-alternatief dan het algoritme, ofwel de set van de regels die een computer vertelt hoe iets te doen. Google doet zeer geheimzinnig over het eigen algoritme, PageRank, genoemd naar Larry Page, maar in een open source omgeving zou de gebruiker gewoon weten hoe het werkt en niet hoeven te vertrouwen op het ‘don’t be evil’-Google.

Punt is dat een zoekmachine probeert een kopie te maken van internet, die indexeert en dan op basis van dat algoritme razendsnel resultaten uitspuugt. Nutch had een jaar geleden zo’n 100 miljoen pagina’s opgeslagen. Dat lijkt veel maar is een fractie van de pakweg 4 (of waren het er al 5) miljard van Google.

Google heeft de hardware – 150.000 pc’s (of zijn het er al 200.000) in zogeheten serverparken – om al die pagina’s op te slaan. Een open source project zou dat nog kunnen nabootsen door gebruik te maken van een peer-to-peer netwerk, zoals Kazaa dat deed. Gedistribueerd computeren, heet dat ook wel. Er zijn prachtige, grote projecten mee op touw gezet.

Maar waar het mis gaat, is de snelheid. De verbindingen tussen al die pc’s zijn in handen van telecombedrijven die er geen enkel belang bij hebben – althans niet de indruk wekken – in ‘search’ te gaan, met elkaar en die moeilijk in de hand te houden open source gemeenschap. Bandbreedte nekt een open source zoekmachine met de ambitie een tweede Google te worden.

Nog belangrijker is dat Google al lang bezig is met het perfectioneren van zijn eigen algoritme. Waarom zou je alleen zoeken op basis van hyperlinks die je waardeert, zoals Google nu ongeveer doet. Als Google weet wie ik ben, wie mijn vrienden zijn, wat ik in mail schrijf, waar ik mijn boeken koop, en welke, en als alle files op mijn computer ook kunnen dienen als ‘overwegingen’ bij mijn zoekopdrachten, worden de resultaten nog veel beter dan ze nu al zijn.

Google is het kwaad niet. Ik vertrouw Sergey Brin, geloof ik. Maar als het bedrijf in laatste instantie, zeg over een jaar of drie, zijn laatste product uit Google Labs los laat op de mensheid, zal blijken wie we hebben vertrouwd. Dat product zal heten Google Think.