Figyelem: beugró nélkül nem értékeljük a második feladatot!
2012-12-19 22:10:35 (CET) 178.48.104.60 direct
2012-12-19 22:21:33 (CET) 80.98.131.55 http://users.itk.ppke.hu/~surma/p/
Minden sor egy dátummal kezdődik, majd a letöltés pontos ideje következik, mellette az időzóna (CET) vagy (CEST), majd a látogató IP címe, és végül a referrer, vagyis annak a weboldalnak az URL-je, ahol a weboldal linkjére kattintottak. Ha ilyen nincs, akkor a tartalom az, hogy "direct", ez van akkor, ha begépelik a weboldal címét, vagy a kedvencekből választják ki. Az egyes mezőket pontosan egy darab szóköz választja el. A sorok időben rendezettek.
A feladat az adott csoport a) b) és c) feladatainak megoldása akár egy programban, akár több, külön programban. A programban használt függvények és rekordok szakszerűsége is számít, nem csak a helyes működés.
b) Néha egy látogató sokszor letölti a weboldalt. Melyik IP címről csinálta a legtöbb olyan oldalletöltést, amikor más nem szakította meg a letöltéseit? (más szavakkal, ugyanaz az IP egymást követő sorokban)
c) A referrer sokszor egy keresőoldal. Feltéve, hogy az URL-ben a keresőszó egy "q=" után következik az első & karakterig, ahol a "q=" előtt közvetelnül & vagy ? karakter áll, melyik a leggyakrabban használt keresőszó? Hány találattal?
b) A 2011-es évben melyik nap volt a legtöbb oldalletöltés?
c) Néha egy látogató többször is letölti a weboldalt. Melyik IP címről érkezett a legtöbb direkt letöltés? Hány letöltéssel?