Tecnologie all’avanguardia per soluzioni pratiche

IA • NLP • ML • SES

La nostra tecnologia integra metodi all’avanguardia e la nostra professionalità si è dimostrata vincente in una ampia gamma di problematiche e obiettivi. Reveal punta su nuove modalità di utilizzo delle tecnologie per superare le consuete limitazioni lessicali. L’impegno della nostra ricerca è focalizzato a produrre soluzioni pratiche e funzionali, realmente rispondenti alle necessità delle organizzazioni.

Ricerca Semantica d’Impresa

Le imprese hanno bisogno di una tecnologia dedicata che superi i limiti dei motori di ricerca.

I moderni sistemi di Information Technology sono utilizzati per trattare un’enorme quantità di informazioni, come i dati memorizzati e prodotti giornalmente nel Web e nei Social Network. La maggior parte della conoscenza umana è rappresentata ed espressa attraverso il linguaggio naturale e una corretta applicazione dei metodi di elaborazione del linguaggio naturale (NLP) è fondamentale per lo sfruttamento di tali dati. L’interpretazione del linguaggio naturale è utilizzata in Reveal per riconoscere le informazioni fondamentali contenute nei documenti e per memorizzarle correttamente al fine di supportare processi di recupero dei documenti rapidi, accurati e proattivi.

Le organizzazioni dipendono da tali meccanismi di recupero in diverse operazioni:

  • Individuare informazioni tecniche utili all’interno dei propri archivi o globalmente nel Web.
  • Individuare informazioni organizzative e logistiche all’interno del proprio ecosistema informativo, solitamente distribuite su sistemi e server diversi e spesso indipendenti.
  • Raccogliere tutte le informazioni su un processo (ad esempio, la verifica di un processo interno o la progettazione di un nuovo prodotto)
  • Riassumendolo in sintesi adeguate ed esaustive.

Tutti questi compiti sono altamente dipendenti dall’organizzazione e sono anche specializzati verso settori specifici di un’organizzazione in modo che aree indipendenti dell’azienda richiedano strategie di ricerca diverse. I requisiti generali di cui sopra costituiscono la base di una tecnologia dedicata necessaria alle imprese, che supera i limiti dei motori di ricerca, chiamata Semantic Enterprise Search (SES)

A sostegno dei processi essenziali del SES, vengono messe a disposizione strutture più complesse che esprimono informazioni significative

I sistemi tradizionali di Information Retrieval (IR) si occupano della rappresentazione, dell’archiviazione, dell’organizzazione e dell’accesso alle informazioni, ad esempio ai documenti, attraverso la codifica dei contenuti dei documenti che sfruttano solo le occorrenze delle parole (cioè a livello di testo completo). Questi metodi sono completamente lessicalizzati e ben consolidati nei motori di ricerca tradizionali. Tuttavia, i progressi di questa tecnologia derivano da rappresentazioni documentali più ricche in grado di esprimere (memorizzare e indicizzare) i contenuti testuali a livello grammaticale e semantico: in questo modo si rendono disponibili strutture più complesse che esprimono informazioni significative, a supporto dei processi SES essenziali di cui sopra (dalla ricerca alla raccolta e alla sintesi concettuale dei documenti), così cruciali per le imprese moderne.

Revealer, la soluzione SES integrativa

Reveal offre soluzioni di SES che integrano la NLP specifica del dominio, la soluzione di machine learning per l’Estrazione delle Informazioni e la classificazione dei documenti, nonché la ricerca di un quadro SES completo, chiamato Revealer.

Reveal supporta l’elaborazione linguistica di diversi tipi di testi (dalle norme ai documenti web, dalle brevi domande ai post sui Social Media e ai micro-post, come ad esempio i tweet) per offrire un ambiente IE integrato su archivi di testo distribuiti e indipendenti. Ciò consente di supportare l’indicizzazione e il rapido recupero di una varietà di fenomeni concettuali, come entità, persone, eventi e informazioni relazionali, cruciali per le funzionalità del SES. Infine, le funzioni di recupero sono abbinate a funzionalità di navigazione che vedono l’archivio dei documenti come un grande grafo di documenti e supportano la ricerca concettuale e la navigazione: la prima, per individuare le informazioni utili e la seconda per utilizzarle come il decollo adatto alla navigazione. In questo modo si realizza un intero ecosistema informativo che integra testi e concetti tutti insieme. Esempi di navigazione all’interno di un tale ecosistema informativo sono riportati nella figura sottostante, all’interno di un dominio finanziario: una grande banca internazionale.

Le unità organizzative della banca (nodi blu) sono collegate ai documenti (nodi arancioni) di cui sono responsabili. Anche i processi (nodi verdi) sono collegati ai primi in base alle relazioni con i documenti (ad es. norme), cioè ai vincoli che questi impongono ai singoli processi.

Un altro esempio è il grafico simile al dendrogramma che rappresenta in modo gerarchico argomenti di discussione indipendenti che derivano dinamicamente dai flussi di tweet quotidiani: nell’esempio di discussione sul caso Giulio Regeni (giugno 2020) sono raggruppati separatamente da altri argomenti orientati alla scuola (come gli esami di maturità di giugno 2020). Questa struttura è interamente prodotta a partire dal sistema e consente nuove forme di interrogazione e di navigazione all’interno della vastissima raccolta di testi corrispondenti ai flussi di tweet.

mentre i livelli (in basso) relativi alla Elaborazione del linguaggio e all’Indicizzazione sono utilizzati per supportare il Data Mining sulla base dei documenti, oltre a capacità avanzate di interrogazione e navigazione. I front-end ereditano così tutta la semantica dal livello inferiore a livello di singolo documento (attraverso la NLP sui testi) alle informazioni e alle conoscenze complessive (riassunte) che emergono dall’intera raccolta di documenti (già elaborate e quindi interpretate) attraverso le capacità di Data Mining per favorire la scoperta e l’analisi delle conoscenze.

Forte integrazione con gli Agenti del Dialogo

L’ambiente SES di Reveal supporta anche le modalità di interrogazione in linguaggio naturale per la risposta a domande basate sul parlato o sul testo, attraverso i contenuti indicizzati.  Questo supporta una forte integrazione con gli agenti del dialogo (conversazionali) in grado di agire come interfacce amichevoli per ricerche complesse (ad es. su problemi di compliance, o operazioni di relazione con i clienti). L’obiettivo principale di un sistema di Question-Answering è quello di rispondere automaticamente a una domanda posta in linguaggio naturale o di recuperare tale risposta in una raccolta di documenti: il problema principale è che, quando si prendono di mira fenomeni a grana fine, le informazioni lessicali da sole non sono sufficienti e qui entra in gioco il pieno sfruttamento delle tecnologie Reveal di NLP.  L’obiettivo primario di un sistema di risposta a una domanda è quello di rispondere automaticamente a una domanda posta in linguaggio naturale o di recuperare la risposta in una raccolta di documenti: il problema chiave è che, quando sono in esame i fenomeni a grana fine, le informazioni lessicali da sole non sono sufficienti ed entra in funzione il pieno sfruttamento delle tecnologie di Reveal di NLP.

TRUSTED BY CUSTOMERS & PARTNERS