Natural hazards pose significant challenges to human societies. With climate change and urban expansion altering the patterns and exposure levels of disasters, the consequences of natural disasters have become more complex than ever before. Therefore, understanding these impacts and designing effective responses require taking human-centered information into consideration. In this context, textual data become a valuable source in disaster research. By adopting natural language processing (NLP) techniques and large language models (LLMs), this thesis leverages two types of textual data — social media posts and institutional reports — to provide human-centered perspectives on disaster impacts and response measures. To examine the usefulness of social media data in drought impact assessment, this thesis designs a semi-automated framework to extract drought-related tweets and classify them into corresponding impact categories. This framework is applied to the 2022 drought in Italy as a case study. The results indicate that public discourse on drought is largely found in Northern Italy, where economic activity is more concentrated. Discussions across all sectors peak in summer, suggesting that the public views drought as a multi-dimensional crisis. In addition, impact scores derived from tweets show a strong correlation with statistical impact data, such as crop prices and hydropower generation, but a weaker correlation with the Standardized Precipitation Index. This study emphasizes that public perceptions of droughts are more related to tangible consequences rather than meteorological conditions, which supports the use of social media as a complementary information source for drought impact assessment. Subsequently, this thesis leverages reports produced by the International Federation of Red Cross and Red Crescent Societies to extend the analysis beyond drought and to address representational gaps in the Global South. A two-step supervised classification framework is developed to retrieve detailed information on disaster impacts and response measures. By covering disaster events in Africa, Asia, and South America, the resulting dataset helps fill critical data gaps in these often underrepresented regions. Furthermore, the disaster impact analysis reveals that infrastructure damage is most frequently reported during cyclones and earthquakes, whereas water availability and malnutrition are major concerns during droughts. With respect to response measures, volunteer mobilization plays a central role across all hazard types. This study demonstrates that institutional reports provide an important lens for systematically examining disaster impacts and response measures, supporting more informed disaster risk management strategies. In summary, this thesis proposes two frameworks to extract and classify disaster-related information from social media posts and institutional reports, respectively. These two studies underscore the potential of textual data in facilitating disaster impact assessment and risk management, offering a promising pathway toward more informed and evidence-based decision-making before, during, and after disaster events.
Le calamità naturali pongono sfide significative alle società umane. Con il cambiamento climatico e l’espansione urbana che modificano i modelli e i livelli di esposizione ai disastri, le conseguenze degli eventi naturali sono diventate più complesse che mai. Pertanto, comprendere tali impatti e progettare risposte efficaci richiede di tenere in considerazione informazioni che pongono al centro l’essere umano. In questo contesto, i dati testuali rappresentano una fonte preziosa nella ricerca sui disastri. Attraverso l’adozione di tecniche di elaborazione del linguaggio naturale (Natural Language Processing, NLP) e di modelli linguistici di grandi dimensioni (Large Language Models, LLM), questa tesi utilizza due tipologie di dati testuali — i post sui social media e i rapporti istituzionali — per fornire prospettive che pongono al centro l’essere umano sugli impatti dei disastri e sulle interventi di risposta. Per esaminare l’utilità dei dati provenienti dai social media nella valutazione degli impatti della siccità, questa tesi sviluppa un framework semi-automatizzato per estrarre tweet relativi alla siccità e classificarli nelle corrispondenti categorie di impatto. Tale framework è applicato alla siccità del 2022 in Italia come caso di studio. I risultati indicano che il discorso pubblico sulla siccità è prevalentemente concentrato nel Nord Italia, dove l’attività economica è più intensa. Le discussioni in tutti i settori raggiungono il picco durante l’estate, suggerendo che il pubblico percepisce la siccità come una crisi multidimensionale. Inoltre, i punteggi di impatto derivati dai tweet mostrano una forte correlazione con dati statistici sugli impatti, quali i prezzi delle colture e la produzione idroelettrica, ma una correlazione più debole con l’Indice di Precipitazione Standardizzato (Standardized Precipitation Index). Questo studio evidenzia come le percezioni pubbliche della siccità siano più strettamente legate alle conseguenze tangibili piuttosto che alle condizioni meteorologiche, a sostegno dell’uso dei social media come fonte informativa complementare per la valutazione degli impatti della siccità. Successivamente, la tesi utilizza i rapporti prodotti dalla Federazione Internazionale delle Società di Croce Rossa e Mezzaluna Rossa per estendere l’analisi più ampia rispetto alla siccità e affrontare le lacune di rappresentazione nel Sud Globale. Viene sviluppato un framework di classificazione supervisionata in due fasi per recuperare informazioni dettagliate sugli impatti dei disastri e sulle interventi di risposta. Coprendo eventi disastrosi in Africa, Asia e Sud America, il dataset risultante contribuisce a colmare importanti lacune informative in queste regioni spesso sottorappresentate. Inoltre, l’analisi degli impatti dei disastri rivela che i danni alle infrastrutture sono riportati con maggiore frequenza durante cicloni e terremoti, mentre la disponibilità idrica e la malnutrizione rappresentano le principali criticità durante le siccità. Per quanto riguarda le interventi di risposta, la mobilitazione dei volontari svolge un ruolo centrale per tutte le tipologie di disastri. Questo studio dimostra che i rapporti istituzionali offrono una prospettiva fondamentale per l’analisi sistematica degli impatti dei disastri e delle interventi di risposta, sostenendo strategie di gestione del rischio più informate. In sintesi, questa tesi propone due framework per l’estrazione e la classificazione di informazioni relative ai disastri, rispettivamente dai post sui social media e dai rapporti istituzionali. Questi due studi evidenziano il potenziale dei dati testuali nel facilitare la valutazione degli impatti dei disastri e la gestione del rischio, offrendo un percorso promettente verso processi decisionali più informati e basati su evidenze prima, durante e dopo calamità naturali.
Dal testo alla comprensione: esplorare l'impatto dei disastri e le risposte attraverso i dati testuali / Wang, J.. - (2026 May 13).
Dal testo alla comprensione: esplorare l'impatto dei disastri e le risposte attraverso i dati testuali
WANG, JINGXIAN
2026-05-13
Abstract
Natural hazards pose significant challenges to human societies. With climate change and urban expansion altering the patterns and exposure levels of disasters, the consequences of natural disasters have become more complex than ever before. Therefore, understanding these impacts and designing effective responses require taking human-centered information into consideration. In this context, textual data become a valuable source in disaster research. By adopting natural language processing (NLP) techniques and large language models (LLMs), this thesis leverages two types of textual data — social media posts and institutional reports — to provide human-centered perspectives on disaster impacts and response measures. To examine the usefulness of social media data in drought impact assessment, this thesis designs a semi-automated framework to extract drought-related tweets and classify them into corresponding impact categories. This framework is applied to the 2022 drought in Italy as a case study. The results indicate that public discourse on drought is largely found in Northern Italy, where economic activity is more concentrated. Discussions across all sectors peak in summer, suggesting that the public views drought as a multi-dimensional crisis. In addition, impact scores derived from tweets show a strong correlation with statistical impact data, such as crop prices and hydropower generation, but a weaker correlation with the Standardized Precipitation Index. This study emphasizes that public perceptions of droughts are more related to tangible consequences rather than meteorological conditions, which supports the use of social media as a complementary information source for drought impact assessment. Subsequently, this thesis leverages reports produced by the International Federation of Red Cross and Red Crescent Societies to extend the analysis beyond drought and to address representational gaps in the Global South. A two-step supervised classification framework is developed to retrieve detailed information on disaster impacts and response measures. By covering disaster events in Africa, Asia, and South America, the resulting dataset helps fill critical data gaps in these often underrepresented regions. Furthermore, the disaster impact analysis reveals that infrastructure damage is most frequently reported during cyclones and earthquakes, whereas water availability and malnutrition are major concerns during droughts. With respect to response measures, volunteer mobilization plays a central role across all hazard types. This study demonstrates that institutional reports provide an important lens for systematically examining disaster impacts and response measures, supporting more informed disaster risk management strategies. In summary, this thesis proposes two frameworks to extract and classify disaster-related information from social media posts and institutional reports, respectively. These two studies underscore the potential of textual data in facilitating disaster impact assessment and risk management, offering a promising pathway toward more informed and evidence-based decision-making before, during, and after disaster events.| File | Dimensione | Formato | |
|---|---|---|---|
|
Revised Thesis_Wang.pdf
embargo fino al 13/05/2027
Descrizione: Tesi def
Tipologia:
Tesi di dottorato
Dimensione
10.53 MB
Formato
Adobe PDF
|
10.53 MB | Adobe PDF | Visualizza/Apri Richiedi una copia |
I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.


