állásokat kereső robot, és weboldal fejlesztése

Közvetlen állások

új adatbázis - indexer módosítás

2011. február 07. - jobkereso

 Az elmúlt hétvégén, illetve előtte is, meg ma is az indexer hegesztésével foglalkoztam. Elsőre sajnos hibás volt a dátumszűrő, és túl sok oldalt dobott ki, drámaian lecsökkentve ezzel az indexelhető lapok számát.

Kénytelen voltam a korábbi adatbázist összekeverni ezzel az újabbal, és a kettőt együtt kitenni, így a régiből az állásajánlatok megmaradtak, csak az újból lett kevés. Ennek viszont az lett a következménye, hogy tele lett az adatbázis már lejárt hirdetésekkel. Mivel ezt a letöltött anyagból döntjük el, és a letöltés, ehez az adatbázishoz január végén történt, a már akkor is kint lévő hirdetések egy része pedig időközben lejárt.

Ezeken kívül, átállítottam az eredménylistát olyanra, hogy az oldalak címe, illetve az url helyett relevánsabb szövegeket tegyen ki. A keresőnk kezd "szemantikus" keresőként működni, mert például ez a címsorbeli szöveg a h1/h2 html tagagből származik. Ezt is módosítottam most, de ez majd csak a következő adatbázisban lesz látható, kiterjesztettem a h1/h2 címsor elemzést olyan div,td,th tag-ekre, amelyekben az class, illetve az id nevében szerepel "title" vagy "cim". Néhány oldalon ilyen tag-ekbe pakolták az állásajánlat megnevezését. A felhasználás nem automatikus, csak akkor jelenik meg a h1/h2 tartalma, ha abban van felismerhető foglalkozás-név, elkerülendő a site önreklámját, vagy irreleváns tartalmakat, pl híreket.

Ami még mindig fájdalmas jelenség, hogy előkerülnek nem állásajánlatok a szűrő után is, illetve olyan oldalak, amelyeken egyszerre több állásajánlat kilistázása található.

Megkezdődött a korábbiaknál agresszívebb kereső-jelenlét. Ezt túlzás lenne seo-nak nevezni, "ráeresztettem" a google-t a search.jsp-re, vagyis az eredménylistára. Megjelent az oldalon egy "utolsó keresések" rovat, a felhasználói élmény fokozása mellett ezzel az is a cél, hogy a kezdőoldalon legyen állásneveket mint anchor text tartalmazó linkek, amelyek saját oldalra mutatnak. Ezzel szeretném képbe hozni a google adatbázisát is, hogy végül is mivel is foglalkozunk itt...

A bejegyzés trackback címe:

https://kozvetlen-allasok.blog.hu/api/trackback/id/tr417686756

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.
süti beállítások módosítása