From szaboj at oszk.hu Wed Nov 3 09:36:15 2004 From: szaboj at oszk.hu (=?ISO-8859-1?Q?Szab=F3_Julianna?=) Date: Wed, 3 Nov 2004 09:36:15 +0100 Subject: [bodza-l] stopwords In-Reply-To: Message-ID: <20041103083616.1D3489E39B@mail.oszk.hu> The following section of this message contains a file attachment prepared for transmission using the Internet MIME message format. If you are using Pegasus Mail, or any another MIME-compliant system, you should be able to save it or view it from within your mailer. If you cannot, please ask your system administrator for assistance. ---- File information ----------- File: stopcim.doc Date: 3 Nov 2004, 9:29 Size: 30720 bytes. Type: Unknown --------- következő rész --------- Egy nem text típusú csatolt állomány át lett konvertálva... Név: stopcim.doc Típus: application/octet-stream Méret: 30720 bytes Leírás: nem elérhető Url : http://maia.bibl.u-szeged.hu/pipermail/bodza-l/attachments/20041103/8e8a9d8b/attachment.obj From szaboj at oszk.hu Wed Nov 3 09:36:15 2004 From: szaboj at oszk.hu (=?ISO-8859-1?Q?Szab=F3_Julianna?=) Date: Wed, 3 Nov 2004 09:36:15 +0100 Subject: [bodza-l] stopwords In-Reply-To: Message-ID: <20041103083616.3BFCE9E8D9@mail.oszk.hu> Tájékoztatásul és megfontolásra melléklelem a MOKKA "cim" böngész?indexében használt stopszavak jegyzékét. Az "Egy" határeset, a legjobb megoldás az lenne, ha ez stopszó is lenne, meg nem is (hallottam ilyen gyakorlatról), ha ez (viszonylag könnyen) megoldható. SzaboJulianna From vidaa at bibl.u-szeged.hu Thu Nov 11 17:11:09 2004 From: vidaa at bibl.u-szeged.hu (vidaa at bibl.u-szeged.hu) Date: Thu, 11 Nov 2004 17:11:09 +0100 Subject: [bodza-l] CD-ROM-ok In-Reply-To: References: Message-ID: <1100189469.41938f1dd0a34@webmail.bibl.u-szeged.hu> sziasztok, Robi és Többiek: azt szeretném megtudni,hogy lenne-e lehetőség az új opacban arra, hogy valaki csak a CD-ROM-jainkra keressen rá, úgy értem: egyszerű olvasó, egyszerű felületen? Ami ugye külön menüpont volt a régi webes opacunkban, ill. a honlapon ezt az oldalt váltaná ki: http://www.bibl.u-szeged.hu/bibl/opac/cd/index.html illetve ugyanez tematikus válogatásban: http://www.bibl.u-szeged.hu/bibl/opac/cd/tema/index.html Valahogy úgy képzelem, hogy mivel a CD-ink adatai ott lapulnak az opacban, valahogy biztos leválogathatók. Ha ügyesen tárgyszavazzuk őket, akkor tematikus listában is szépen előjönnének. Csak ne kelljen ehhez ccl-ismeret az olvasóinknak. Ez megoldható szerintetek? Andi ---------------------------------------------------- SZTE Egyetemi Könyvtár - http://www.bibl.u-szeged.hu This mail sent through IMP: http://horde.org/imp/ From vidaa at bibl.u-szeged.hu Thu Nov 11 17:15:13 2004 From: vidaa at bibl.u-szeged.hu (vidaa at bibl.u-szeged.hu) Date: Thu, 11 Nov 2004 17:15:13 +0100 Subject: [bodza-l] =?iso-8859-2?q?BRS-adatb=E1zisok?= In-Reply-To: References: Message-ID: <1100189713.41939011aa152@webmail.bibl.u-szeged.hu> szintén a régi webes felületen elérhető katalógusunk külön menüpontja volt a BRS-adatbázisok. Ezeket hogy oldjuk meg az új katalógusban? Azért érdekel ez is, hogy a honlapon külön ki kell-e emelni, (mit régen), és ha igen, akkor milyen címen? Andi ---------------------------------------------------- SZTE Egyetemi Könyvtár - http://www.bibl.u-szeged.hu This mail sent through IMP: http://horde.org/imp/ From rhz at bibl.u-szeged.hu Thu Nov 11 17:41:17 2004 From: rhz at bibl.u-szeged.hu (Zawiasa Robert) Date: Thu, 11 Nov 2004 17:41:17 +0100 (CET) Subject: [bodza-l] Re: CD-ROM-ok In-Reply-To: <1100189469.41938f1dd0a34@webmail.bibl.u-szeged.hu> Message-ID: > azt szeretném megtudni,hogy lenne-e lehetőség az új opacban arra, hogy valaki > csak a CD-ROM-jainkra keressen rá, úgy értem: egyszerű olvasó, egyszerű felületen? persze, de nem a nyitasra. > http://www.bibl.u-szeged.hu/bibl/opac/cd/index.html > http://www.bibl.u-szeged.hu/bibl/opac/cd/tema/index.html > > Valahogy úgy képzelem, hogy mivel a CD-ink adatai ott lapulnak az opacban, > valahogy biztos leválogathatók. Ha ügyesen tárgyszavazzuk őket, akkor tematikus > listában is szépen előjönnének. meg tudnank csinalni, hogy akar ugyanolyan talalasban jojjon elo, ahogyan a fenti sztatikus lapokon latszik, de automatice generalva beleintegralva az opac-ba. a reszleteket kidolgozando le kell majd ulnunk szerintem leghamarabb januarban. jo otlet. From rhz at bibl.u-szeged.hu Thu Nov 11 17:46:41 2004 From: rhz at bibl.u-szeged.hu (Zawiasa Robert) Date: Thu, 11 Nov 2004 17:46:41 +0100 (CET) Subject: [bodza-l] Re: =?iso-8859-2?q?BRS-adatb=E1zisok?= In-Reply-To: <1100189713.41939011aa152@webmail.bibl.u-szeged.hu> Message-ID: > szintén a régi webes felületen elérhető katalógusunk külön menüpontja volt a > BRS-adatbázisok. Ezeket hogy oldjuk meg az új katalógusban? > Azért érdekel ez is, hogy a honlapon külön ki kell-e emelni, (mit régen), és ha > igen, akkor milyen címen? mindent fokozatosan. a brs is egyelore marad a regi cimen regi formajaban. elobb-utobb attoltom bodza-ba, addig valoban kell valami utalas az uj opac feluletrol ezekre a "legacy" rendszerekre, mint a cdrom-ok is. nyitasig lesz ra gondom. From bakonyi at bibl.u-szeged.hu Thu Nov 11 19:53:40 2004 From: bakonyi at bibl.u-szeged.hu (Bakonyi Geza) Date: Thu, 11 Nov 2004 19:53:40 +0100 (CET) Subject: [bodza-l] =?iso-8859-2?q?BRS-adatb=E1zisok?= In-Reply-To: <1100189713.41939011aa152@webmail.bibl.u-szeged.hu> Message-ID: a brs adatbázisokat bodza alatt szeretnám megoldani, ha lehet. de gondolom, ez már csak januári téma lehet ... On Thu, 11 Nov 2004 vidaa at bibl.u-szeged.hu wrote: > szintén a régi webes felületen elérhető katalógusunk külön menüpontja volt a > BRS-adatbázisok. Ezeket hogy oldjuk meg az új katalógusban? > Azért érdekel ez is, hogy a honlapon külön ki kell-e emelni, (mit régen), és ha > igen, akkor milyen címen? > Andi > > ---------------------------------------------------- > SZTE Egyetemi Könyvtár - http://www.bibl.u-szeged.hu > This mail sent through IMP: http://horde.org/imp/ > > > _______________________________________________ > bodza-l mailing list > bodza-l at bibl.u-szeged.hu > http://lists.bibl.u-szeged.hu/mailman/listinfo/bodza-l > From rozsondaib at vax.mtak.hu Thu Nov 25 15:14:03 2004 From: rozsondaib at vax.mtak.hu (Rozsondai Bela) Date: Thu, 25 Nov 2004 15:14:03 +0100 Subject: [bodza-l] stop words -- rendezes Message-ID: <41A5E8AB.3040908@vax.mtak.hu> Kedves Kolléganők, Kollégák! Kihagytam pár hetet, elnézést kérek ezért. Vissza kell térnem a fenti két témához. Valójában két külön fogalomról és két külön problémáról van szó! Most csak felvetem a problémákat, megoldást nem tudok javasolni. ----- 1. Stop word: olyan szó, amelyet a rendszer az indexek építésekor is, a kereső kérdés feldolgozásakor is figyelmen kívül hagy. Ilyen szavak: névelők, prepozíciók, kötőszók stb. Stop list: ezen szavak jegyzéke, táblája. A stop list tartalma függ a nyelvtől. Pl. "die" a németben stop word kell legyen, az angolban nem stop word! A MOKKA-R rekordjaiban a leírt dokumentumok között sokféle nyelvű előfordul: latin, ógörög stb. és az élő nyelvek. A bibliográfiai leírás nyelve pedig - felteszem, minthogy magyarországi könyvtárak anyagáról van szó - magyar. A HUNMARC (és MARC 21 stb.) formátumban mindkettő: a dokumentum nyelve(i) is, és a leírás nyelve is a megfelelő mezőkben kódolva van. Kérdések: Lehet-e, érdemes-e a rekordban található nyelvkódokat MOKKA-R-ben felhasználni? Legyen-e, lehet-e MOKKA-R-ben több stop list, külön-külön az egyes nyelvekhez? Külön gondot okozhatnak a többnyelvű dokumentumok. Melyik legyen a mérvadó, a dokumentum nyelve, vagy a leírás nyelve? Azokban a katalógusokban, amelyekből MOKKA-R felépül, megvannak-e a nyelvkódok, s ha igen, összeegyeztethetők-e a különböző formátumok? Meg kellene nézni, hogy e katalógusokban milyen stop listákat használnak. Szabó Julianna közreadott egy ilyen listát. Megjegyzés: Meg kell különböztetnünk az index építésének folyamatát és a keresés folyamatát. Azt sejtem, hogy az indexek építésekor fel lehetne használni (ha egyáltalán lehet) az egyes rekordokban lévő nyelvkódokat és a több különböző stop listát (ha vannak); kereséskor azonban csakis valamilyen összesített, a különböző nyelvek listáiból egyesített stop lista szerepelhet, és a keresés folyamatában nem lehet figyelembe venni a rekordokban lévő nyelvkódokat. Az egyesített stop lista használatát esetleg rugalmasabbá lehet tenni: Bizonyos rendszerekben a kereső kérdésbe megfelelő jellel (pl. + jellel) ellátva olyan szavakat is beírhatunk, amelyeket keresni akarunk, bár a stop listában szerepelnek. Ennek persze csak akkor van értelme, ha az adott szó bekerült az indexbe. ----- 2. Rendezés, azaz a találati halmaz elemeinek rendezése különböző szempontok szerint. Most a címek betűrendbe sorolásáról van szó. Mint korábban egyszer, ismét hivatkozom az MSZ 3493 : 1982 : Bibliográfiai tételek besorolási szabályai szabványra. (Sajnos most nincs kezemben; remélem, jól emlékszem.) Ha a cím ragozatlan névelővel kezdődik, a besoroláskor ezt figyelmen kívül kell hagyni. Kérdés: Össze lehetne-e állítani MOKKA-R-ben eme névelők listáját? Vigyázat: ez nem a stop list, ezt valahogyan másképpen kellene nevezni! Megjegyzések: (a) Gondot okoznak pl. a következők: - függ a nyelvtől, pl. németben "die" a cím elején figyelmen kívül hagyandó, angolban azonban be kell számítani, pl.: Die hard (film) - a névelő állhat a címben "főszerepben" is, pl.: Der..., die..., das... : a német nyelvtan gyakorlati útmutatója / Markó Ivánné - a névelő más esete azonos alakú lehet az alanyesettel (de lehet, hogy ekkor is figyelmen kívül kell hagyni?), pl.: Der neuen Gedichte anderer Teil / Rainer Maria Rilke - számnév, névmás azonos alakú lehet egy névelővel, pl.: Egy az Isten. (b) Tehát esetenként kell eldönteni, hogy a cím első szava valóban ragozatlan névelő-e vagy valami más. (c) Enyhítő körülmény: Ha a "névelővel" kezdődő cím első szavát a rendezéskor figyelembe vesszük, illetve nem vesszük figyelembe, akkor a mellőzött címalakról utaló készíthető. Pontosabban lásd: MSZ 3440/4 : 1986 : A bibliográfiai leírás besorolási adatai : címek. 2.8, 2.9 szakasz. (d) HUNMARC stb.-ben az adott címmező 1., illetve 2. indikátorában jelezni kell a rendezéskor elhagyandó karakterek számát. Kérdések: Meg lehetne-e valósítani MOKKA-R-ben a rendezést a fenti előírások (az idézett szabványok) szerint? Az eseti döntésekhez segítségül lehetne-e venni a HUNMARC mező megfelelő indikátorát? Készítsünk-e a mellőzött címalakról utalót, azaz bekerüljön-e a cím az indexbe névelővel is, és névelő nélkül is (lásd az alábbi megjegyzést)? Megjegyzés: A rendezés (tehát a jelen 2. pont) fent vázolt problémái nemcsak a találati halmaz elemeinek rendezésére, hanem - ami sokkal fontosabb - az index építésére, vagyis az indexben az indextételek rendezésére, és ezzel a böngészéskor (scan) kinyíló listára is vonatkoznak. Kérem, gondoljuk meg együtt, vitassuk meg! Üdvözlettel, Rozsondai Béla MTA Könyvtára