Friday, December 15, 2006

As bases de dados climatológicas

Os dados meteorológicos constituem a base fundamental de um trabalho sobre a variabilidade climática. Da sua qualidade depende a qualidade final da investigação. A comunidade científica dispõe hoje de uma grande variedade de dados, grande parte de livre acesso. Contudo, esta grande disponibilidade de dados a custos reduzidos, é um fenómeno relativamente recente. A isto não será estranho o grande desenvolvimento que a climatologia tem demonstrado a nível mundial. Também relevante é o facto de a um grande aumento na quantidade dos dados, haver um igual aumento na qualidade, o que à partida poderá até parecer contraditório. Este aumento na qualidade e quantidade de dados fica a dever-se a variadíssimos factores, entre os quais se destacam os seguintes:

1. Desenvolvimento e maior rigor nas técnicas de controlo de qualidade dos dados climáticos

As técnicas de controlo de qualidade dos dados climáticos têm conhecido um desenvolvimento cada vez maior. Exemplo disto são as crescentes preocupações dos climatólogos sobre este aspecto traduzido num reforço da consciência de que é absolutamente necessário trabalhar com informação quantitativa fiável, sob pena de os resultados poderem ser irrealistas. Os artigos específicos sobre este aspecto existem já em grande número dos quais se destacam os trabalhos de Peterson e Easterling (1994), Easterling e Peterson (1995), Easterling et al. (1996), Hansen-Bauer e Forland (1994), Alexandersson (1984 e 1986), Alexandersson e Morberg (1997); Morberg e Alexandersson (1997). Os dados organizados em redes regulares também são dotados de rigoroso controlo de qualidade, pelo menos os oriundos dos principais centros de investigação.

2. Desenvolvimento da informática

O desenvolvimento da informática permitiu o tratamento de cada vez maiores volumes de dados em espaços de tempo cada vez mais reduzidos. Também gerou grande desenvolvimento para a construção de bases de dados, em que algumas delas se actualizam quase em tempo real. Da mesma forma, a capacidade de armazanamento aumentou grandemente, possibilitando dispôr de bases de dados cada vez mais completas e complexas. Os dados estão hoje disponíveis em inúmeros formatos diferentes. Para além dos formatos mais comuns, tais como texto ascii (.txt) ou folhas de cálculo (.wk1 ou .xls, respectivamente Lotus e Excel), há também a considerar os formatos binários (IEEE – floating point 32 ou 64 bit little-endian; IEEE - floating point 32 ou 64 bit big-endian), GRIB (Gridded Binary), HDF (Hierarchical Data Format), NetCDF (Network Commom Data Format), entre outros. Estes últimos formatos permitiram a criação e fácil divulgação de bases de dados que até há relativamente poucos anos não se encontravam disponíveis para os utilizadores individuais e, acima de tudo, armazenar maiores quantidades de informação em menores quantidades de memória. Exemplos disto são os ficheiros GRIB, formato da Organização Meteorológica Mundial, e são usados por inúmeros centros meteorológicos, um pouco por toda a parte, para guardar e trocar informação organizada em campos meteorológicos e climatológicos. A grande vantagem destes ficheiros é que, com eles, consegue-se guardar grandes volumes de dados em metade ou um terço do tamanho do que seria de esperar para ficheiros mais comuns em formato binário (float 32bits ou 64 bits). Já os formatos NetCDF têm outras características. São utilizados à semelhança do formato GRIB, para campos meteorológicos e climatológicos, mas têm outras especificidades. Assim, um ficheiro de formato NetCDF tem as seguintes características, que podem ser consideradas como inovadoras:

a) Contém informação sobre os dados a que se refere o ficheiro;
b) São ficheiros (à semelhança dos formatos Grib) que podem ter várias dimensões, para uma melhor análise dos campos meteorológicos. Os ficheiros mais comuns são tridimensionais caso se trate, por exemplo, de dados de superfície (Lat., Long. e Tempo) ou então, tetradimensionais, para os ficheiros que se reportam a dados a vários níveis da atmosfera (Lat., Long., Tempo e Nível).
c) A arquitectura do ficheiro é independente do hardware (máquina) que o gerou, permitindo que tipos muito diferentes de computadores, estações de trabalho, computadores pessoais, etc, possam, sem dificuldade ler os dados, bastando para isso que disponham de software adequado;
d) A extracção de janelas espacio-temporais está muito simplificada neste tipo de ficheiros. Quer isto dizer que se se pretender somente analisar uma parte do Globo Terrestre e/ou uma parte do período disponível, tal pode ser feito sem que para isso seja necessário ler todo o ficheiro;
e) Os ficheiros NetCDF permitem actualizações e junção de nova informação, numa só dimensão, ou a todas, sem ser necessário redefinir toda a estrtura do ficheiro;
f) Por fim, estes ficheiros permitem o acesso a vários utilizadores ao mesmo tempo.

3. Desenvolvimento dos modelos de simulação climática, de circulação geral e assimilação de dados

A evolução informática possibilitou também uma grande evolução nos modelos de circulação geral e de simulação climática. Os dados, sobretudo os de carácter global organizados em mapas de resoluções muito diversificadas (campos meteorológicos), conheceram um grande desenvolvimento. No entanto, a construção de ficheiros globais reveste-se de alguns problemas, sobretudo os ligados à interpolação de dados, uma vez que não se dispõe de informação para todas as áreas do Globo Terrestre. Frequentemente, a interpolação era feita de forma subjectiva, por investigadores que teriam à priori um bom conhecimento da forma das estruturas dinâmicas mais típicas presentes nas variáveis meteorológicas e climatológicas (oceânicas e atmosféricas). A assimilação de dados é hoje um processo corrente que consiste na recolha de dados de observação em diferentes pontos do Globo, os quais são posteriormente inseridos num modelo de circulação geral em modo de prognóstico, ou numa combinação entre modelos atmosféricos e estatísticos. Este facto vai não só permitir “encher” de informação as zonas das quais não é possível obtê-la de forma directa (por exemplo, o Pacífico Sul e regiões polares), mas também gerar de forma indirecta outros parâmetros meteorológicos dos quais não se dispõe de medições directas. Estão neste caso os dados das Reanálises do NCEP/NCAR (Kalnay et al., 1996).

4. O advento da internet

O advento da internet, a sua rápida evolução e desenvolvimento, permitiriam a rápida dissiminação de informação, quer qualitativa, quer quantitativa. Uma grande variedade de dados está hoje disponível na internet o que faz com que as diferentes bases de dados e diferentes ficheiros sejam intensivamente testados por toda a comunidade científica. Assim, as bases de dados são testadas pelos utilizadores que podem aceder a grande parte delas sem custos adicionais
A acompanhar o desenvolvimento da informática, a internet possibilitou ainda grandes avanços no desenvolvimento de software específico para fins climatológicos, no que diz respeito ao manuseamento, leitura e tratamento estatístico de dados climáticos. Gostaria aqui de salientar o software GrADS (Grid Analysis and Display System) que foi disponibilizado por um conjunto de investigadores e que o colocaram disponível a toda a comunidade científica para o seu uso e desenvolvimento. De referir que este software foi largamente utilizado ao longo deste trabalho. Também largamente utilizado foi o software desenvolvido e disponibilizado pelo Theoretical Climate Dynamics (TCD) da UCLA, no seu site de internet designado por SSA-MTM Toolkit (Dettinger et al.,1995; Ghil et al. ,2002), para a análise de séries temporais.

Bibliografia:

Alexandersson, H. (1984) – A homogeneity test based on ratios and applied to precipitation series. Reports nº 79, Dept. of Meteorology, Upsala, Sweden, pp. 55.

Alexandersson, H, (1986) - A Homogeneity Test Applied to Precipitation Data. Journal of Climatology, 6: 661-675.

Alexandersson, H.; Moberg, A. (1997) – Homogeneization of Swedish temperature data. Part I : Homogeneity test for linear trends. International Journal of Climatology, 17: 25-34.
Easterling, D.R.; Peterson, T.C. (1995) - A new method for detecting and adjusting undocumented discontinuities in climatological time series. International Journal of Climatology, 15: 369-377

Dettinger, M.D.; Ghil, M.; Strong, C.M.; Weibel, W.; Yiou, P. (1995) – Software expedites singular-spectrum analysis of noisy time series. Eos, Trans. American Geophysical Union, 76(2): 12,14,21

Easterling, D.R.; Peterson, T.C.; Karl, T.R. (1996) - On the development and use of homogeneized climate data sets.Journal of Climate, 96: 1429-1434

Ghil, M.; Allen. M.R.; Dettinger, M.D.; Ide, K.; Kondrashov, D.; Mann, M.E.; Robertson, A.W.; Saunders, A.; Tian, Y.; Varadi, F.; Yiou, P. (2002) - Advanced Spectral Methods for climatic time series. Reviews of Geophysics, 40 (1): 1-41.

Hanse-Bauer, I.; Forland, E.J. (1994) – Homogenizing long Norwegian precipitation series. Journal of Climate, 7: 1001-1013.

Kalnay, E.; Kanamitsu, M.; Kistler, R., Collins, W.; Deaven, D.; Gandin, L.; Iredell, M.; Saha, S.; White, G.; Wollen, J.; Zhu, Y.; Letman, A.; Reynolds, R.; Chelliah, M.; Ebisuzaki, W.; Higgins, W.; Janowiak, J.; Moo, K.C.; Ropelewski, C.; Wang, J.; Jenne, R; Josepf, D. (1996) – The NCEP/NCAR 40-Year Reanalysis Project. Bulletin of the American Meteorological Society, Março

Peterson,T.C.; Easterling,D.R. (1994) - Creation of homogeneous composite climatological reference series. International Journal of Climatology, 14: 671-679.

Moberg, A.; Alexandersson, H. (1997) – Homogenization of Swedish temperature data. Part II: homogenized gridded air temperature compared with a subset of global gridded air temperature since 1861. International Journal of Climatology, 17: 35-54.

PTG

No comments: