NOVÉ SMĚRY VE VÝVOJI KLIMATOLOGICKÝCH DATABÁZÍ
Převratný vývoj informačních technologií v posledních letech způsobuje posun v chápání potřeb a možností klimatologů ve správě klimatologických dat. Prakticky úplné opuštění operačního systému DOS, nové operační systémy Windows 9x a Windows NT, práce v počítačových sítích a podpora aplikací s architekturou klient-server umožňují i klimatologům z menších meteorologických služeb vážně uvažovat o relační klimatologické databázi, splňující i ty nejnáročnější požadavky.
Příznivější vývoj cen spojený s tímto vývojem umožnil zavádět do praxe aplikace postavené nad standardními relačními databázovými systémy (ORACLE, INFORMIX, SYBASE apod.). Český hydrometeorologický ústav se připojil k mezinárodním aktivitám na tomto poli a od počátku roku 1997 intenzivně pracuje na vývoji vlastní klimatologické databázové aplikace v systému ORACLE.
VYUŽÍVÁNÍ DATABÁZÍ V KLIMATOLOGII
Množství klimatologických údajů, počínající potřeba jejich využívání v reálném čase a zkrácení intervalu měření v souvislosti s automatizací pozorovací sítě, vyzdvihuje nutnost využívání rozsáhlé a moderní databáze. Současný stav využívání databází v členských zemích SMO byl zjišťován formou dotazníku [1], na který odpovědělo 83 zemí. Celých 60 % z odpovědí (50 zemí) uvedlo, že využívá CLICOM, relační databázi využívá zbývajících 33 zemí. Obsahem nejrozsáhlejší z nich jsou uvedeny v tab. 1.
Tab. 1. Velikost vybraných databází v zemích SMO.
Dalším zajímavým produktem této dotazníkové akce byla statistika finančních nákladů na vývoj a provoz středně velké databáze (velikost 10 - 30 GB). Na vývoj je třeba podle zkušeností uvedených zemí počítat s fondem pracovní doby ve výši 2 až 4 tisíce hodin, hardwarové a softwarové vybavení
(včetně vývoje) spotřebuje minimálně 1,5 miliónů USD a provoz s administrací výsledné aplikace je zajišťován dvěma pracovníky.
AKTIVITY SMO
Začátkem devadesátých let začali někteří klimatologové na mezinárodních akcích pořádaných a sponzorovaných SMO diskutovat o aplikaci některého RDBMS (Relation Database Management System) se širokým uplatněním v klimatologii. V této době se uvažovalo o systémech Oracle, Ingres nebo Informix. Některé z vyspělých národních meteorologických služeb používají tyto systémy již delší dobu, diskuse byly však zaměřeny na aplikaci podporovanou SMO, která je určena menším národním meteorologickým službám. V publikacích SMO se výsledky těchto diskusí objevují postupně od roku 1994 [3, 4, 5].
Expert Meeting on the Future Evolution of WMO Coordinated Climate Database Management Systems
(Washington D.C., USA, 29 -31 August 1994)
Závěry z tohoto jednání daly rámec dalšímu vývoji v této oblasti. Z dnešního pohledu se mohou tyto závěry zdát příliš obecné, ale to nic nemění na jejich důležitosti. Jsou zde zmíněny všechny hlavní oblasti budoucích problémů souvisejících s vývojem nové aplikace (dokončení vývoje CLICOM, použití distribuovaných databází, využití WWW, apod.).
RA III CLICOM Expert Meeting
(Santiago de Chile, Chile, 6 - 18 November 1995)
V závěrech tohoto jednání expertů je doporučení účastnit se vývoje nového systému CLICOM založeného na databázi Oracle. V doporučení je zdůrazněna nutnost napojení na telekomunikační síť meteorologických služeb a možnost spouštění aplikace v různých operačních systémech. Účastníci zároveň doporučují SMO koordinovat vývoj CDBMS (Climate Database Management System) ajako příklad možné použité databáze je uveden Oracle 7.0.
Meeting on CLICOM Implementation and Development (Washington D.C., USA, 6 -17 May 1996)
Na tomto setkání experti diskutovali o možnostech přechodu zpracování klimatologických dat ze systému CLICOM 3.0 do systému nového (nejlépe založeného na RDBMS) a shodli se na vytvoření sady instalačních disket CLICOMu verze 3.1. Zároveň se experti shodli, že tato verze CLICOMu již bude poslední. Jejímu vytvoření se budou věnovat hlavně kolegové z Ruské federace a základem změn bude odstranění všech chyb a základních nedostatků verze 3.0.
Expert Meeting to Review and Assess the Oracle-based Prototype for Future CDBMS
(Toulouse, France, 12 -16 May 1997)
Základem programu tohoto setkání [4] expertů byl konkrétní záměr prodiskutovat a posoudit prototypové návrhy klimatologických databázových aplikací navrhovaných v databázi Oracle. Oproti tomuto záměru proběhla úvodem prezentace základních vlastností již hotových CDBMS jednotlivých národních meteorologických služeb:
- Francie - Météo France - Oracle,
- Kanada - Atmospheric Environmental Service - Oracle,
- Austrálie - Australian Bureau of Meteorology - Oracle,
- Německo - Deutsche Wetterdienst - Oracle,
- Finsko - Finland Meteorological Institute - Oracle,
- Velká Británie - UK Met Office - různé, SQL propojené databáze.
Teprve poté byly předvedeny dva prototypy částí CDBMS vyvinuté v Kostarice a v České republice. V obou případech je vývoj založen na tříúrovňové architektuře klient-aplikace- data. V případě prototypu vyvinutého v Kostarice je tento požadavek zajišťován pomocí programu Microsoft Transaction Server, český přístup je založen na plnohodnotném využití vlastností databáze Oracle a její architektury klient-server, pokud možno bez softwarových mezikroků. Oba přístupy předpokládají napojení na internet/intranet a na geografické informační systémy s využitím přenosového protokolu TCP/IP. Pouze český přístup však zatím předpokládá přímý import dat z databáze DataEase a tím možnost snadného přechodu zpracování dat z CLICOMu na nový systém (podrobnosti o českém návrhu jsou uvedeny v dalších částech tohoto článku). Experti se shodli na potřebě dalšího vývoje naznačeným směrem. Důraz bude kladen na správu metadat (popisných údajů o stanicích, pozorovaných prvcích, přístrojích a časových rozvrzích pozorování) a na možnost práce s některými částmi aplikace prostřednictvím internetové sítě s důrazem na maximální bezpečnost uložených klimatických dat.
PŘEDPOKLÁDANÁ STRUKTURA APLIKACE CLIDATA
Již nyní je možné naznačit v hrubých rysech strukturu vyvíjené databázové klimatologické aplikace CLIDATA [2]. Při analýze jsme si stanovili několik základních podmínek, které by měla aplikace splňovat:
- využití databáze ORACLE,
- architektura client-server,
- minimalizace programování komponent, které jsou dostupné na softwarovém trhu a „umí“ pracovat s daty v databázi (např. statistické balíky, geografické informační systémy, apod.),
- maximální bezpečnost dat v databázi a zároveň možnost práce přes internet (generování HTML formátů, spolupráce s ústavním web serverem, apod.),
- replikace databáze mezi centrem a pobočkami,
- přímý import dat z CLICOMU do nového prostředí,
- hierarchická struktura uživatelů s přísným vymezením práv.
Aplikace bude mít sedm základních částí - Metadata, Data, Povinné produkty, Ostatní produkty, Pořizování a kontrola, Systémová správa aplikace a CLICOM.
METADATA
Část Metadata obsahuje veškeré popisné informace o meteorologických stanicích, pozorovaných prvcích a časových rozvrzích pozorování. V této části jsme se ve velké míře inspirovali současně používanou databází CLICOM - některé její části jsme převzali zcela, jiné jsme zjednodušili a po konzultaci s reportérem SMO pro metadata (Reino Heino, Finský meteorologický ústav) jsme se rozhodli rozšířit tuto část o některé další informace (fyzickogeografický popis okolí stanice a grafické informace o stanici). Novinkou je zde zavedení tzv. časových rozvrhů pozorování, výpočtů a měření pro jednotlivé meteorologické prvky - rozvrh pravidelných pozorování - např. SYNOP, nebo 15 minutová pozorování AMS (Automatické meteorologické stanice, klimatologický rozvrh pozorování (např. 07, 14 a 21 hodin pro teplotu nebo 07 hodin pro srážky na klimatologických stanicích, apod.) a výpočtový rozvrh (např. pro průměrné denní hodnoty, denní úhrn slunečního svitu apod.). Tento způsob definování intervalů měření a pozorování radikálně zjednodušuje práci s meteorologickými prvky v databázi.
DATA
V této části jsou definovány datové modely (datovým modelem rozumíme způsob uložení dat v databázi) pro všechny typy měřených a pozorovaných dat. Hlavní datový model v aplikaci CLIDATA umožňuje uložit všechna základní data do jednoho typu tabulky bez nutnosti definovat zvláštní datové struktury pro 15 minutová, hodinová nebo klimatologická měření. Bylo by možné uložit do shodné struktury i hodnoty minutových srážkových úhrnů (intenzity srážek), které jsou standardním výstupem z AMS. Pro tato data jsme však navrhli zvláštní datový model (z důvodu odlišných požadavků uživatelů na práci s těmito daty a z důvodu nutnosti redukce „nulových“ úhrnů srážek ve vstupních záznamech). Třetím typem datového modelu je model pro uložení informací o meteorologických jevech a bouřkách - databázové uložení těchto dat bylo zatím v meteorologickém světě opomíjeno.
POVINNÉ PRODUKTY
V této části jsou definovány výpočty hodnot, které nelze v klimatologické práci postrádat nebo které jsou nutné pro správnou práci celé aplikace (např. pro kontrolu klimatologických dat). Správce systému v této části definuje nejprve strukturu výpočtu pentádových, dekádních a měsíčních průměrů, úhrnů, maxim, minim a počtu dní s překročením nebo nedosažením definovaného limitu. Dále je zde definován seznam prvků a období pro výpočet dlouhodobých průměrů, extrémů a empirického rozdělení četnosti překročení - tyto hodnoty systém používá při kontrole klimatologických dat, uživatel zde najde i tabulku normálů. V této části bude uživatelům dostupný i tzv. inventář dat (přehled dat uložených v databázi).
Výpočet výše uvedených hodnot probíhá automaticky nezávisle na uživateli podle rozvrhů definovaných správcem systému. Uživatel s příslušným oprávněním má však možnost provést výpočet dlouhodobých průměrů a extrémů pro vybrané prvky za nestandardní období (např. pro posudkovou činnost) - systém však umožní uložit výsledky jen za jedno nestandardní období pro prvek a stanici (je nutno bránit nekontrolovatelnému přeplnění databáze).
OSTATNÍ PRODUKTY
Do této části budou definovány některé speciální klimatologické produkty, pro které nejsou k dispozici standardní softwarové nástroje (např. výpočet větrných růžic, definování tzv. stálých dotazů apod.).
POŘIZOVÁNÍ A KONTROLA
Část pořizování dat musí být v aplikaci řešena - nelze předpokládat 100% automatizaci měřící sítě a stále existuje nutnost pořizování historických klimatologických dat. Kontrola dat je v aplikaci řešena v několika úrovních. Jsou to:
- statická (jednostaniční) kontrola s využitím dlouhodobých průměru a extrémů,
- prostorová kontrola s využitím empirických hodnot četnosti překročení,
- kontrola nepominutelných limitů některých prvků a
- kontrola logické správnosti, fyzikální nerozpornosti a přesnosti kódování ustávajících nebo dříve používaných meteorologických depeší.
Na rozdíl od stávající databáze CLICOM jsou zkontrolovaná i nezkontrolovaná data uložena ve stejné tabulce s použitím indikace stupně validace. Zásah do validovaných dat je omezen jen na uživatele s nejvyšším stupněm oprávnění.
SYSTÉMOVÁ SPRÁVA APLIKACE
Některé limity a hodnoty platné pro celou aplikaci používanou v daném regionu jsou definovány v systémové tabulce (např. maximální a minimální nadmořská výška, geografické souřadnice, základní typ času, normálové období apod.).
CLICOM
Všechny části aplikace nutné pro spolupráci se stávající databází jsou sdruženy zde - import formuláře STN GEO-GRAPHY do části Metadata, import datových DBM souborů do hlavní datové tabulky, apod.
ZÁVĚR
Předložené zamyšlení nad rozvojem klimatologie v oblasti klimatologických databází má podat čtenáři stručnou informaci o mezinárodních souvislostech vývoje nových aplikací. Větší prostor je věnován přípravě aplikace v Českém hydro-meteorologickém ústavu a autor zamyšlení předpokládá, že postupně s realizací jednotlivých naznačených částí budou čtenáři seznamováni s odbornými souvislostmi a dalšími podrobnostmi v samostatných článcích. Případné náměty, přicházející ze široké meteorologické obce a směřující k rozšíření systému v rámci logiky jeho výstavby jsou vítány.
Literatura:
[1] Bénichou, F. - Lee, D.: Use of Relational Database Management Systems in Climatology in WMO National Meteorological Service. In: Climate Database in Europe. In: Proceedings of the ECSN Workshop on Climate Databases, Norrkoping, Sweden 1996, s. 9 -14.
[2] Coufal, L. - Tolasz, R.: A Climate Data Processing, Con¬trol, Information and Archiving System (tentative proposal). At: World Climate Programme - Data and Monitoring, No. 34, Annex 14, WMO-TD Preliminary, Geneva 1997.
[3] World Climate Programme - Clicom News, No. 9. Geneva, WMO 1995.
[4] World Climate Programme - Data and Monitoring, No. 30: Summary Notes and Recommendations Assembled for CCl-XII from Recent Activities Concerning Climate Data Management. WMO-TD No. 832. Geneva 1997.
[5] World Climate Programme - Data and Monitoring, No. 31: Reports for CCl-XII from Rapporteurs that Relate to Climate Data Management. WMO-TD No. 833. Geneva 1997.
Lektor RNDr L. Coufal, rukopis odevzdán v listopadu 1997.
Radim Tolasz, MZ 1998/3, ročník 51, str. 85-87