állásokat kereső robot, és weboldal fejlesztése

Közvetlen állások

Snippet generálás

2011. november 27. - jobkereso

 Saját kezembe vettem a snippet-ek létrehozását.

A snippet az a szöveg ami az egyes találatok url-je alatt található, és amiben bolddal kiemelve szokott megjelenni az amire kerestünk. Ezeket a keresőmotor generálja az oldal elmentett szövegéből, valamilyen logika szerint, attól függően hogy mire kerestünk éppen rá. Ebből lehet kitalálni nagyjából hogy az oldal miről szólhat, és hogy erre voltunk-e kiváncsiak, a link kinyitása nélkül.

Amit csináltam, az viszont ilyen értelemben nem kontextus érzékeny, minden weboldalhoz egy bizonyos szöveget rendel, ami elvileg magát az állásajánlat lényegi részét tartalmazza. Tehát az eddigiekben, a keresett kifejezésnek megfelelően valami, amiben az a kifejezés megvolt, kikerült az oldalra, de ez sokszor valamilyen más az oldalon lévő tartalom volt, pl. hirdetés, vagy néhányszor rejtett szöveg, vagy egy témába vágó cikk, ami mellett van állásajánlat is, de a snippet nem abból generálódik.

Az, hogy a lényegi állásajánlat kerüljön ki, úgy értem el, hogy feldaraboltam a teljes szöveget az oldalon space és írásjelek mentén. Az így kapott szó tömböt analizálom. Ha kapok közöttük egy nagyjából összefüggő részt amiben az állásokra jellemző szavak gyakran és egy csoportban követik egymást, akkor az a csoport, valamilyen előre-hátra ráhagyással bekerül a snippet mezőbe, space-el összefűzve, és az oldalt találat esetén ez jellemzi.

Ennek a megoldásnak sajnos az a következménye, hogy per pillanat nem tudom az eredeti írásjeleket és kisbetű/nagybetű különbségeket rekonstruálni, az elemzés meg nem menne az eredeti szövegen. Hát ezen majd még dolgozni kell, de most nincs túl sok időm rá.

 

A bejegyzés trackback címe:

https://kozvetlen-allasok.blog.hu/api/trackback/id/tr467686750

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.
süti beállítások módosítása