5.2 Scenarij 2: Obstoječa strukturirana datoteka
Kaj imamo?
Imamo elektronsko strukturirano podatkovno datoteko, ki pa je vezana na licenčno (plačljivo) programsko opremo. Primer je npr. datoteka XLS in XLSX (MS Excel), ki vsebuje več zavihkov (Sheets), dodatno oblikovanje, funkcije, enačbe, grafe ipd.
Kaj naredimo?
Vsak zavitek (Sheet) moramo shraniti kot ločen dokument in ga nato pretvoriti v odprti format, npr. CSV. Vsaka tabela mora tako predstavljati vsebinsko celoto. Vsakemu dokumentu CSV določimo ime in strukturo v skladu s priporočili (glej Scenarij 1). Shranjevanje datotek CSV iz programa MS Excel Če tabele ne vsebujejo črk »čšžČŠŽ« in posebnih znakov, potem lahko posamezni zavihek shranimo v format CSV (Commadelimited *.csv) kar iz aplikacije MS Excel. V nasprotnem primeru priporočamo, da za tvorjenje datotek CSV uporabljate druge brezplačne programe, ki omogočajo nastavitev kodiranja (priporočeno v UTF-8). Ti programi so spletni Google Spreadsheet ali samostojni programi Notepad++, Open Office JustWorks ali Calc, LibreOffice ipd. Če vseeno za ustvarjanje datotek CSV želite uporabljati MS Excel, lahko datoteke shranite kot "UnicodeText (.txt)", ki uporablja kodiranje UTF-16, vendar boste naknadno v dokumentu morali tabulatorje (dolge presledke) nadomestiti s podpičji ";" ter spremeniti končnico dokumenta (.csv).
Ustvarjanje podatkovnih ključev
Zaradi olajševanja kasnejše ponovne uporabe podatkov se v podatkih določi tudi stolpec, ki vsebuje unikatni identifikator (ključ), ki enolično označuje vsak posamezni zapis. Ta identifikator so lahko zaporedna številka zapisa, strojno določena številka, datum, kombinacija datuma in ure ipd. Pri ustvarjanju ključa se posvetujte z informatikom, ki vam bo pomagal pri določitvi in vzdrževanju ključa.