Adatbázisok workshop

Adatbázisok a történeti tudományokban műhelykonferencia

2021.12.04.
Adatbázisok a történeti tudományokban műhelykonferencia

2021. november 19-én, pénteken 13.00 órai kezdéssel az ELTE BTK-n került megrendezésre az Összehasonlító Történeti Szociológia Tanszék ElitData Kutatócsoportja, a Professzionalizáció-történeti Kutatócsoport és az ELTE BTK-TÁTK Társadalmi Változások Története Kutatóközpont szervezésében az Adatbázis építés - használat - fenntartás a történeti tudományokban című műhelykonferencia.

Az alábbiakban közzétesszük az előadásokról készített videófelvételeket, az előadások rövid összefoglalóját és vetített prezentációját!

HALMOS Károly: Kezdetek és előzmények: számítógép a történettudományban

Halmos Károly, az ELTE BTK Gazdaság-és Társadalomtörténeti Tanszékének docense előadásában az adatbázis építések kezdetére repítette vissza a hallgatókat. A számítógép megjelenése a történettudományban mérföldkőnek tekinthető, azonban a régi adatbázisok szűk kapacitású környezetben készültek, így kompromisszumokat kellett kötni az adatok bevitele során. Jelenleg sok adatbázis esetében nem az felületekre történő feltöltés kérdése a legfontosabb, hanem a teljeskörű adatok és anyagok – kompromisszumok nélküli – feltöltése jelentené a prioritást. Az adatok felvitele mellett párhuzamosan az egységesítésen is szükséges gondolkozni, ugyanis a történészek a saját kutatásaik alapján nagyon egyedi és egyéni rendszer alapján gyűjtik az adataikat. A történeti gyűjtésekből sok esetben hiányoznak azok a kollektív vonások, szigorú rendszerek, amelyek a szociológiai kutatásokban megjelennek. Emellett a történeti adatbázisok esetében gyakori, hogy az adatgyűjtés okát és a kódolást nem rögzítették a kutatók, így az adatok későbbi felhasználása a kutató nélkül szinte lehetetlen. Ennek az is az oka lehet, hogy az adatbázis építések jelentős része a hivatalos történírás perifériáján zajlott, sokáig nem vált központi jelentőségűvé a kérdés. Az előadásban hangsúlyosan megjelent, hogy bár ezek a hibák léteznek, könnyen kiküszöbölhetővé válnának az egyetemi hallgatók tudatos felkészítésével, oktatásával. A digitális történészek képzése nagy előrelépést jelentene a tudományterületen és a későbbi történeti adatbázisok elkészítésekor is.

Az előadás megtekinthető ide kattintva!

FAZEKAS István és KÁDÁR Zsófia: Jezsuita gimnáziumi adatbázisok

Milyen információkkal szolgálnak a 17. századbeli jezsuita gimnáziumok anyakönyvei? – Ezt a kérdést válaszolta meg Fazekas István (ELTE BTK Történeti Intézet Kora Újkori Történeti Tanszék, Katolikus iskoláztatás a kora újkori Magyarországon Kutatócsoport) és Kádár Zsófia (Katolikus iskoláztatás a kora újkori Magyarországon Kutatócsoport) az Adatbázis építés - használat - fenntartás a történeti tudományokban című workshopon.

A hazai jezsuita gimnáziumok diákjainak előmenetelével foglakozó kutatócsoport olyan forrásanyaghoz nyúlt, amely általában csak a helytörténészek látókörébe kerül. Évekkel ezelőtt azonban Fazekas István és Kádár Zsófia a munkatársaikkal együtt a 17. századi, jezsuita gimnáziumok alapítása óta rendelkezésre álló iskolai anyakönyvek vizsgálatába kezdett, így, egy eddig szűk kutatói körnek elérhető forrásanyag szélesebb körű felhasználása indult el. A 17. században a jezsuita gimnáziumok a katolikus iskoláztatás terén monopol helyzetet foglaltak el az országban, valamint az iskolák között a belső kommunikáció fejlett és jól szabályzott volt. Ennek eredményeképpen a 16. század óta rendelkezésre állnak az iskolákba beiratkozó diákok anyakönyvei, melyekben a diákok neve, származási helye, nációja, társadalmi státusza, tanulmányai adatai és egyéb megjegyzések szerepelnek. A vizsgálat során Nagyszombat, Győr és Pozsony városainak diákságával foglalkoztak a kutatók, a meglévő forrásbázis digitalizálása után többek között az egyes iskolák évfolyamszerkezetével, életkori megoszlásával, a diákok iskolák közötti mozgásával és későbbi előmenetelével is foglalkoztak. Emellett nem elhanyagolható a jezsuita gimnáziumok a városra és a régióra gyakorolt hatása sem.

Az eddigi kutatási eredmények elérhetőek a Hungaricana honlapján, valamint hamarosan nyomtatott formátumban is.

Az előadás megtekinthető ide kattintva!

Az elődás prezentációja ide kattintva tekinthető meg!

SASFI Csaba: Gimnáziumi iskolai anyakönyvi adatbázisok

Milyen nehézségekbe ütköznek a kutatók a történeti adatok vizsgálata és gyűjtése során? Sasfi Csaba, a Professzionalizáció-történeti Kutatócsoport történésze az Adatbázis építés - használat - fenntartás a történeti tudományokban workshopon ezt a kérdést járta körül. A történész a 18-19. századi középiskolai előmenetellel foglalkozott, ezen a példán és az általa gyűjtött adatokon mutatta be a kutatás szépségeit és nehézségeit. Meglepő módon a középiskolák esetében már a 18. század végétől rendelkezünk formalizált, jól standardizált anyakönyvekkel – ez a magas minőségű dokumentáltság a jezsuita gimnáziumok hagyományának továbbviteleként értelmezhető. Emellett egy állami szintű igény is mutatkozott a dokumentációra: az iskoláknak az évente, rutinszerűen elkészített anyakönyveket – amely a diákok személyi adatait, intézményi adatokat, tanulmányi eredményeket, szülői adatok és egyéb megjegyzéseket tartalmaztak – fel kellett küldeniük a helytartótanácshoz. A helytartótanácshoz beszolgáltatott példány mellett az iskolák saját maguk számára is készítettek, egy általában alaposabb és részletesebb anyakönyvi kivonatot. Ezek az adatok viszonylag könnyen digitalizálhatóak, az eredeti dokumentumról készült fotó és egy kereshető online formátum könnyen összekapcsolható, így a dokumentum kutathatóságát is magasabb szintre emelve. Azonban az egyénenként létrejövő adatfile-oknak a változásokat is tudnia kell kezelni: a névváltozatok, nemesi nevek megszerzése és elveszítése dinamikussá teszi a felületet. A történész szerint ezért az adatbázisok építése során szükséges külső segítséget is bevonni, hogy az adatok a legjobb minőségben kerüljenek rögzítésre.

Az előadás megtekinthető ide kattintva!

Az elődás prezentációja ide kattintva tekinthető meg!

ŐRI Péter: Történeti demográfiai mintavételes adatbázisok: MOSAIC projekt

Őri Péter a KSH Népességtudományi Kutatóintézetének igazgatóhelyettese az előadásában a MOSAIC- projektről, valamint annak magyarországi adatbázisáról beszélt. A projekt célja a kontinentális Európa országainak történeti demográfiai adatainak gyűjtése, adatbázisok készítése, valamint elérhetővé tétele kutatók, szakdolgozók és érdeklődők számára. A történeti demográfiai adatgyűjtések során vagy keresztmetszeti adatokhoz nyúlnak a kutatók, amely során egy, az időből kiragadott időpontban gyűjtenek össze minden lehetséges forrást a kutatott személyről, vagy pedig hosszmetszeti vizsgálatot végeznek, amely kevésbé részletes adatok, hosszú időtávon, akár egy életen át történő gyűjtését jelenti. A magyarországi MOSAIC projektben e két mintavétel keverékét használták: a családszerkezetről keresztmetszeti adatokat gyűjtöttek, míg a családtörténetet hosszmetszeti adatokkal tárták fel a kutatók. Magyarországon az adatbázis építéshez szükséges információkat az 1869-es népszámlálás biztosította, amely összeírás az írni és olvasni tudást és a születési helyet is rögzítette. A népszámlálási adatok 44 teljes településről és pár töredéktelepülésről maradtak fenn, így a projektben nagyjából 6500 háztartás került leírásra. A megmaradt adatokat régió, felekezet szerinti megoszlás alapján súlyozták, hogy országosan reprezentatívvá tegyék, valamint a gördülékeny kutatás érdekében igyekeztek a korábbi és későbbi összeírások fogalomhasználatát egyeztetni. A létrejövő adatbázis segítségével így mára magyar adatokkal is jelen tudnak lenni a MOSAIC-projektben, amely lehetőséget biztosít összehasonlító elemzések elkészítéséhez, mint például az európai házasodási mintázatok feltárása.

Az előadás megtekinthető ide kattintva!

Az elődás prezentációja ide kattintva tekinthető meg!

BARTHA Diána és KISS Zsuzsanna: A Kovács I. Gábor féle prozopográfiai adatbázis új ruhája - az ELITDATA projekt

Milyen lehetőségeket rejt a történeti adatok digitalizációja? Kiss Zsuzsanna, az ELTE TáTK Összehasonlító Történeti Szociológia Tanszékének adjunktusa, valamint Bartha Diána a Prozopográfiai és Családtörténeti kutatócsoport kutatási asszisztense az 1980-es évek óta folyó tudáselit kutatásról tartottak előadást. A Tanszéken folyó elitkutatás Kovács István Gábor vezetésével a politikai, gazdasági, egyházi, katonai és tudáselit működési, szerkezeti és rekrutációs mintázatainak feltárására fókuszált. A jelenleg futó projektben az adatbázis digitalizálása, valamint Wikidata felületre történő átültetése zajlik.

A Wikidata egy, a Wikipédia elvét követő felület, amelynek célja az adatok strukturált tárolása és az egyszerű kereshetőség megvalósítása. A szakirodalom információs gráfként is említi a felületet, amelyen a feltöltött entitások (helyszínek, fogalmak, személyes stb.) és a hozzájuk rendelt tulajdonságok – a Wikipédiához hasonlóan – hivatkozási linkekként jelennek meg. Így az egy felületen megjelenő információk a linkek segítségével összekapcsolódnak és továbbirányítják az érdeklődőket a „gráf mélyebb rétegeibe”. Az információk összekapcsoltsága lehetővé teszi az összefüggések feltárását, valamint az összehasonlító kutatások elkészítését. A felületet nem csak humántudományi területeken használják, de természettudományi kutatások eredményeinek tárolására és összekapcsolására is kiválóan alkalmas a felület.

Az ELTE-n folyó kutatás a polgári korban egyetemi tanári pozíciót betöltő személyek demográfiai, mobilitási és családtörténeti adatinak összegyűjtésére vállalkozott. Jelenleg ezeknek az adatoknak a digitalizációja és egységessé tétele zajlik, valamint emellett az adatbázisban szereplő egyének földrajzi és társadalmi mobiliásának vizsgálata. A kutatás lehetőséget enged nem csak a történeti kutatások és a digitális eszközök összekapcsolására, de az adatok új, szociológiai szempontból történő vizsgálatára is.

Az előadás megtekinthető ide kattintva!

Az elődás prezentációja ide kattintva tekinthető meg!

GERHARD Péter: Levéltári (közgyűjteményi) adatbázisok

Gerhard Péter, Budapest Főváros Levéltára E-Levéltári és informatikai osztályának osztályvezetője a levéltári adatok digitalizációjának fontosságáról beszélt a megrendezett Adatbázis-workshopon. A főlevéltáros az előadása első részében felvázolta az angolszász és kontinentális európai országok levéltárai között fellelhető legfőbb különbséget: míg az angolszász területeken gyűjtemények szintjén rendezik az anyagokat, addig a kontinensen, így Magyarországon is sokkal erősebb hierarchia érvényesül. Ez, az országunkban is megvalósuló rendezési elv a kutatások során nehézséget okoz, hiszen az iratanyagokon belüli keresés nem triviális, valamint már a kutatáshoz leginkább megfelelő dokumentum kiválasztása sem egyértelmű, hiszen különböző fondok alatt is lehetnek egymással összefüggő információk. A kutatások megkönnyítése és a megőrzés érdekében mára a levéltári adatok digitalizációja egy előre meghatározott adatszerkezet mentén elkezdődött, azonban jelenleg teljes adatbázisokra még nem lehet rákeresni. A levéltárakban tárolt, szinte elképzelhetetlen mennyiségű adat digitalizációja csakis az informatika segítségével történhet meg: a kézírás felismerésére specializálódott programok, az idegennyelvről történő automatikus fordítások elkészítéséhez szükséges tudás felértékelődik, ezek segítsége nélkül az adatok digitalizálása szinte lehetetlen. Azonban a digitalizáció sem oldaná meg az összes felmerülő problémát, ugyanis a levéltári adatok kutathatóságánál nagyon szigorú a személyes adatok védelmére vonatkozó jogszabály, amely újabb nehézségeket gördít a kutatók elé.

Az előadás megtekinthető ide kattintva!

MARÓTHY Szilvia: Adatbázis használat és építés a Nyílt tudomány gyakorlata jegyében: open data adatbázisok

Mi ösztönözheti a kutatókat abban, hogy a kutatási projektjük kapcsán ne csupán az elkészült publikációt tegyék elérhetővé, hanem a kutatás lépéseit, az elkészített adatbázisokat is megosszák az olvasókkal? A nyílt tudomány és az adatbázisok használatának kérdésköreit járta végig Maróthy Szilvia az előadásában (Bölcsészettudományi Kutatóközpont Irodalomtudományi Intézet).

Miben új a nyílt tudomány megközelítése? A nyílt tudomány – open science – területe szerint a kutatás minden lépése, legyen szó fotókról, összeállított adatbázisokról vagy elkészített programkódokról, tudományos eredmény. Az open science több területen is megújíthatná a tudományos kutatásokhoz fűződő viszonyunkat. Egyrészt, az open science előretörésével a háttérmunka – amely sokszor a kutatások legfáradságosabb része – is tudomány munkaként és eredményként lenne elismerve. Emellett a tudományos eredmények megőrzése is könnyebbé, korszerűbbé válna. A közös megőrzési repozitóriumok miatt nem merülne fel az a már jól ismert probléma, miszerint az adatok tárolásának formája elavulttá válik. Mindannyian láttunk már papíron, kézzel írt adatokat és flopi lemezeken tárolt bázisokat, amelyekről ma már csak nagy erőfeszítésekkel nyerhetjük ki az információt. Az open science térnyerésével a tudományos munka átláthatósága is, valamint az elérhetőség révén a kutatásokra való hivatkozások száma is növekedne. Párhuzamosan azonban a forráskritikánknak is élesebbé kell válnia: az online források esetében elengedhetetlen, hogy tudjuk, ki hozta létre az adatokat és így a tudományos eredményeket. A kritikus viszony a forrásokhoz lehetővé tenné, hogy a tudományos eredmények elérhetőek, közérthetőek és megbecsültek legyenek, azonban nem növekedne az álhírek, áltudományos eredmények száma.

Az előadás megtekinthető ide kattintva!

Az elődás prezentációja ide kattintva tekinthető meg!

PALKÓ Gábor: ELTE BTK TI Digitális Bölcsészet Tanszék - Lehetőségek és perspektívák

Hogyan kapcsolódhatnak a humántudományok az informatika területéhez? Palkó Gábor (ELTE BTK Digitális Bölcsészet Tanszék) előadásában az ELTE-n folyó adatbázis-fejlesztésekbe, továbbképzésekbe és kutatásokba engedett bepillantást.

Az ELTE BTK Digitális Bölcsészet Tanszéke pontosan e két, a humántudományok és az informatika területének összeházasításán dolgozik: szeretnék bemutatni és átadni azt a tudást, amellyel lehetőség nyílik a humántudományok és a 21. században elengedhetetlen digitális ismeretek összekapcsolására. Ennek eredményeképpen a BTK-n minden alapszakos hallgató részt vesz egy bevezetőkurzuson, amelynek célja, hogy a hallgatók megismerjék a tudományterületek közötti átjárás lehetőségeit, valamint a BTK PhD hallgatói workshop keretein belül tanulhatnak a digitális technikák és a saját kutatási területük kapcsolatáról. A Tanszéken emellett számos önálló kutatás is folyik, többek között vers-és sajtókorpusz építése, valamint prozopográfiai és humanizmus kutatások. A Digitális Bölcsészet Tanszék arra törekszik, hogy bemutassa a nyílt és összekapcsolt adatbázisok újszerűségét és megvalósíthatóságát. A BTK-n folyó kutatások eredményei a Wikidata egy önálló és kívülről nem szerkeszthető adathálózatába kerülnek fel, amely felületen előre nem definiált lekérdezések, vizualizáció, valamint az adattár folyamatos bővétése valósulhat meg.

Az előadás megtekinthető ide kattintva!