Suskaitmeninti JAV lietuvių laikraščiai

  Straipsnis iš Enciklopedijos Lietuvai ir Pasauliui (ELIP).

  Pradžia

  2007 m. tapęs laikraščio „Draugas” tarybos nariu dr. Jonas Daugirdas ir pradėjęs domėtis nuo 1909 m. leidžiamo "Draugo" archyvais, internete užtiko nuo 1817 metų Škotijoje leidžiamo laikraščio „The Scotsman” internetinę svetainę. Joje visi laikraščio numeriai buvo tvarkingai suskaitmeninti, įdiegta paieškos programa.

  Taip dr. J. Daugirdui gimė mintis imtis ir JAV lietuviškos spaudos skaitmeninimo.

  Tam buvo kreiptasi į kelias specialistų bendroves, kad jos paskaičiuotų, kiek kainuotų sukurti skaitmeninį visų „Draugo” numerių archyvą. Gavus jų skaičius,jog tų darbų kainos siektų 300.000 dolerių ir daugiau dėl tokios milžiniškos sumos darbai pradėti nebuvo.

  2015 m. pagerėjus "Draugas" finansinei situacijai vėl grįžo mintys apie laikraščio skaitmeninimą.

  Dr. J. Daugirdas tuo metu internete užtiko straipsnį apie informacinių technologijų (IT) specialistą Tom Tryniski, gyvenantį New Buffalo, NY. Šis žmogus, pamilęs čia leidžiamus istorinius laikraščius, pats įsigijo mikrofilmų skenavimo mašinas. Jis perdirbo savo namų kieme esančią pavėsinę ir joje įkūrė kompiuterių centrą, kuriame pigiau negu kitur buvo atliekami suskaitmenino darbai.

  "Draugo" skaitmeninimas

  Rezume

  Suskaitmeninta apie 250.000 buvusių "Draugo" (1909 - ...) puslapių ir apie 4.000 numerių jo priedo "Mokslas, Menas, Literatūra" (jame 32 000 straipsnių, 1949–2018 m.)

  19092007 m. apimantis "Draugo" archyvas yra atviras visiems.

  Nuo 2008 m. archyvas sudarytas iš „Draugo” skaitmeninių failų (kurie siųsti spaustuvėn), ir tie numeriai šiuo metu prieinami tik „Draugo” prenumeratoriams.

  Suskaitmeninta informacija 2017 m. liepos mėn. buvo pradėta talpinti internete, laikraščio Draugas svetainėje. Serverio paslaugų (shared hosting space) teikėju buvo pasirinktas Hostway

  Eiga

  Skaitmeninimo organizavimas vyko pagal tokį planą:
  1) pirmiausia reikėjo surinkti informaciją kur yra ar gali būti "Draugo" mikrofilmai ir atspausdinti numeriai.
  2) toliau buvo surinkti (išnuomoti) visi esantys mikrofilmai.
  3) visi surinkta mikrofilmų medžiaga persiųsta skenavimui T. Tryniski.
  4) gautus nuskenuotus atskirus puslapius reikėjo techniškai sudėti į atskirus vienetus (numerius) ir juos patalpinti į bendrą duomenų bazę. Siekiant ekonomiškumo techniniams darbams buvo pagal sutartis samdomi įvairiose pasaulio šalyse gyvenantys specialistai.
  5) galiausiai reikėjo įkurti naują svetainę suskaitmenintai medžiagai (apie 150 gigabitų) laikyti ir publikuoti => http://www.spauda.org
  6) suorganizuoti paieškos sistemą pasinaudojant Google „Custom Site Search” (kuri susidaro iš 130 atskirų paieškos naršyklių).

  Darbo eigoje paaiškėjo, kad nemaža dalis „Draugo” numerių yra saugoma mikrofilmuose trijose JAV bibliotekose:
  1) Daugiausiai laikraščio numerių yra saugoma JAV Kongreso bibliotekoje: egzemplioriai iš Antrojo pasaulinio karo laikotarpio, ir daug numerių išleistų 1958 - 2008 m. laikotarpiu.
  2) Čikagos universiteto regioninė archyvinė biblioteka (Center for Research Libraries) mikrofilmų kolekcijos archyvuose yra saugomi „Draugų” numeriai išleisti 1920 - 1930 m.
  3) Kent State University, OH bibliotekos archyvuose yra saugomi 1909–1919 m. į mikrofilmus perkelti "Draugo" laikraščio numeriai.

  "Draugo" archyvai saugomi:
  1) 2008 m. pačiame "Drauge" buvo pradėti kaupti sumaketuoti PDF failuose „Draugo” numeriai, kurie siunčiami spaustuvėn.
  2) 19091919 m. laikotarpio "Draugo" mikrofilmai yra saugomi Amerikos lietuvių kultūros archyve (ALKA).
  3) Lietuvos nacionalinėje Martyno Mažvydo bibliotekoje irgi saugoma daug „Draugo” ir MML numerių.

  Darbo eigoje paaiškėjo, kad: 1920 ir 1921 m. kasdien būdavo išleidžiami du skirtingi numeriai – „miesto laida” („City Edition” ir „šalies laida’’ („Country Edition”). Iki šių dienų ta informacija buvo pamiršta; kad „Draugas” praeityje buvo du kartus eksperimentavęs, leisdamas numerius ir anglų kalba. Pirmas toks bandymas buvo 19461947 m., antras – 19961997 m.

  Problemos

  Dėl mikrofilmų kokybės. Kent State University saugomų 1912–1919 ir 1958 m. „Draugo” numerių mikrofilmų tekstai buvo gana sunkiai perskaitomi, todėl kompiuterinės atpažinimo programos (OCR) daug ką praleisdavo.
  Daugelyje iš Kongreso bibliotekos esančių mikrofilmų irgi buvo trūkumų – daug numerių iš viso nebuvo nufotografuoti, o kituose numerių filmuose, arba trūko puslapių, arba kai kur puslapio vaizdas nebuvo visas sutalpintas į filmo kadrą. Tuos puslapius ar numerius reikėjo iš naujo fotografuoti ar skenuoti.

  Surinkus visą informaciją apie mikrofilmus, paaiškėjo, kad kai kurie kuriais laikotarpiais jie nebuvo padaryti. Todėl trūkstamų numerių buvo ieškoma saugomų spausdintų numerių archyvuose ir daromos skaitmeninės jų kopijos.

  Niekur nepavyko surasti 1916 m. išleistų dienraščio numerių. Surasti tų metų savaitraščiai, bet dienraščio, kuris pradėtas leisti kovo 31 (ar balandžio 1) d. iki šiol nepavyko surasti.

  Straipsnių paieška

  Paieška galima 2 būdais:
  1) naudojant Google paieškos programą.
  2) "Draugas" svetainėje.

  Pvz.: atsidaromas archyvo rodyklės 1921 m. puslapis ir įrašoma žmogaus pavardė.
  => Paieškos rezultatuose matysime kuriuose 1921 m. numeriuose ta pavardė buvo minima.
  Po to reikia atsiųsti to numerio PDF, jį atidaryti vartojant programą „Acrobat Reader” ir tame numeryje vėl įrašyti paieškos žodį, kad atrastumei laikraštyje tą vietą, kurioje tas žodis buvo minimas (aš su PC vartoju CTRL-F, kuris reiškia „find”). Ta pati paieškos sistema galioja ir MML.

  Yra ruošiama visų 32,000 straipsnių, išspausdintų MML, rodyklė pagal autoriaus pavardę bei straipsnio pavadinimą ir kategoriją.

  Nuorodos

  Kiti archyvai
  Draugas News / LH prenumeratoriams

  Nuorodos, šaltiniai


  Pasaulio Lituanistikos Tyrimo Centro (PLTC)

  Sudarytojai, rašytojai ir redaktoriai

  Kitur naudojant ar cituojant šį straipsnį, būtina nurodyti jo sumanytojus, sudarytojus, rašytojus ir redaktorius.
  • Edvinas Giedrimas – autorius ir redaktorius – 109% (+9546-824=8722 wiki spaudos ženklai).