Scienza dei materiali

Stabilire Standard per Massimizzare il Beneficio dell’Intelligenza Artificiale

mm
Securities.io maintains rigorous editorial standards and may receive compensation from reviewed links. We are not a registered investment adviser and this is not investment advice. Please view our affiliate disclosure.

La scienza dei materiali sta cambiando rapidamente con l’ascesa dell’intelligenza artificiale (AI) e del machine learning (ML). Questi strumenti stanno trasformando il modo in cui scopriamo, progettiamo e ottimizziamo nuovi materiali per affrontare le grandi sfide nell’energia pulita e nella produzione sostenibile, nell’elettronica avanzata e nella biomedicina.

Tuttavia, ottenere il massimo dall’AI nella ricerca sui materiali richiede più di semplici algoritmi sofisticati e grandi quantità di dati. È necessaria un’infrastruttura robusta e standardizzata per accedere, condividere e integrare i dati dei materiali provenienti da diverse fonti e domini. Senza standard, i ricercatori affrontano grandi ostacoli nell’addestrare modelli accurati e generalizzabili e nel trasferire i loro risultati nel mondo reale.

Qui esamineremo l’importanza degli standard dei dati per la scoperta di materiali guidata dall’AI, con un focus sulla nuova Open Databases Integration for Materials Design (OPTIMADE) iniziativa. Copriremo le sfide dello scambio di dati sui materiali, le funzionalità e i vantaggi dell’API OPTIMADE, e esempi reali di come questo standard stia già cambiando la ricerca sui materiali. Infine, guarderemo al futuro di OPTIMADE e a cosa potrebbe significare per l’innovazione nei nuovi materiali.

Optimade API Call

Le Sfide dello Scambio di Dati sui Materiali

Per comprendere l’importanza degli standard dei dati nella scienza dei materiali, è necessario capire le sfide che i ricercatori affrontano nell’accedere e integrare dati provenienti da diverse fonti.

I dati dei materiali sono stati sparsi in un panorama frammentato di database, ciascuno con il proprio schema di dati, API e protocolli di accesso. Questa mancanza di interoperabilità rappresenta un grande ostacolo per i ricercatori che desiderano costruire modelli di machine learning o effettuare data mining su larga scala.

Prendiamo, ad esempio, un ricercatore di materiali che vuole scoprire nuovi materiali per batterie. Per addestrare un modello predittivo, dovrebbe raccogliere dati su un’ampia gamma di composti batterici noti, le loro strutture cristalline, le proprietà elettrochimiche e le condizioni di sintesi.

Tuttavia, questi dati sono probabilmente distribuiti su più database, ognuno con il proprio modo di rappresentare e fornire le informazioni.

Per ottenere i dati rilevanti, il ricercatore dovrebbe:

  • Scrivere codice personalizzato per interrogare l’API di ciascun database
  • Navigare il loro schema unico
  • Pulire e unire i risultati in un formato coerente.

Questo è dispendioso in termini di tempo, soggetto a errori e richiede competenze tecniche al di fuori del dominio principale del ricercatore.

La Dott.ssa Julia Ling, scienziata di informatica dei materiali presso il Lawrence Berkeley National Laboratory, ha vissuto questa situazione in prima persona. Dice:

“Nel mio lavoro, devo spesso integrare dati da più database per costruire set di addestramento completi per i miei modelli di machine learning. Ma la mancanza di standardizzazione tra questi database è un grosso problema. Posso trascorrere settimane a scrivere script di elaborazione dei dati prima di poter anche solo iniziare ad addestrare i miei modelli.”

Il problema è aggravato dal fatto che molti database di materiali sono custoditi in gruppi di ricerca o istituzioni individuali, così i ricercatori esterni non riescono nemmeno a trovarli, figuriamoci ad accedere a dati potenzialmente preziosi. Questa mancanza di visibilità e accessibilità sta frenando la scienza e causando duplicazioni inutili di sforzi.

Il Dott. Bryce Meredig, cofondatore e Chief Science Officer di Citrine Informatics, afferma:

“Lo stato attuale dei dati sui materiali è un caos. Sono sparsi, eterogenei e spesso poco documentati. Questo rende impossibile utilizzare questi dati in modo efficace, soprattutto per il machine learning.”

La Necessità di Standard Comunitari

Per superare queste sfide e ottenere il massimo dall’AI nella ricerca sui materiali, la comunità ha bisogno di un insieme comune di standard e protocolli per lo scambio di dati. Questi standard dovrebbero consentire ai ricercatori di accedere e integrare dati da diverse fonti in un formato coerente e leggibile dalla macchina, senza dover navigare le complessità di ciascun database.

Questi standard devono essere sviluppati e adottati dalla comunità in modo aperto e collaborativo. Non possono essere imposti dall’alto da una singola istituzione o fornitore di database. Devono emergere da un processo di consenso e iterazione con il contributo di una vasta gamma di parti interessate provenienti dal mondo accademico, dall’industria e dal governo.

I benefici sono chiari. Fornendo un linguaggio e un quadro comune per lo scambio di dati sui materiali, è possibile ridurre le barriere all’accesso e all’integrazione dei dati e consentire ai ricercatori di dedicare più tempo alla scienza e meno al trattamento dei dati. Inoltre, possono abilitare un ricco ecosistema di strumenti e servizi interoperabili, che vanno dalle piattaforme di visualizzazione e analisi dei dati a pipeline di scoperta automatizzate e basi di conoscenza.

La Dott.ssa Kristin Persson, direttrice del Materials Project presso il Lawrence Berkeley National Laboratory, afferma che gli standard comunitari sono fondamentali per ottenere il massimo dall’AI nella scienza dei materiali. Ha aggiunto:

“Concordando su un insieme comune di principi e protocolli per lo scambio di dati, possiamo aprire un intero nuovo livello di collaborazione e innovazione nella ricerca sui materiali. Non si tratta solo di rendere i dati più accessibili, ma di abilitare una nuova scienza che prima era impossibile.”

L’Ascesa di OPTIMADE

Riconoscendo la necessità di standard comunitari nello scambio di dati sui materiali, un gruppo di principali database di materiali e fornitori di software si è riunito nel 2016 per lanciare l’iniziativa Open Databases Integration for Materials Design (OPTIMADE).

L’obiettivo di OPTIMADE è sviluppare una specifica API comune per interrogare e recuperare dati dai database di materiali in un formato standardizzato e leggibile dalla macchina. Fornendo un’interfaccia unica a molti database, OPTIMADE renderà più semplice per i ricercatori accedere e integrare i dati dei materiali nei loro flussi di lavoro, indipendentemente dal database o dal software utilizzato.

La specifica OPTIMADE si basa su un design web RESTful che utilizza protocolli HTTP standard e formati di dati JSON per abilitare la comunicazione tra database e applicazioni client. Definisce un insieme di endpoint comuni e parametri di query che i database possono implementare per esporre i loro dati in modo standardizzato e auto-descrittivo.

Ad esempio, un’applicazione client può inviare una semplice richiesta HTTP GET a un database conforme a OPTIMADE con i parametri di query in un formato standardizzato per cercare materiali contenenti ferro e ossigeno.

Il server del database traduce quindi questa richiesta nel proprio linguaggio di query, esegue la ricerca e restituisce i risultati in JSON. L’applicazione client può quindi analizzare e processare quei risultati usando strumenti e librerie standard senza conoscere lo schema o i dettagli di implementazione del database sottostante.

OPTIMADE in Azione

Dal 2019, OPTIMADE è stato adottato da molti database di materiali e strumenti software.

Un esempio è il Materials Project, un popolare database di proprietà dei materiali calcolate ospitato dal Lawrence Berkeley National Laboratory. Nel 2020, il team del Materials Project ha implementato un’API OPTIMADE affinché gli utenti potessero accedere al suo vasto dataset usando parametri di query standard e formati di risposta.

Secondo il Dott. Shyam Dwaraknath, architetto capo del database:

“L’API OPTIMADE del Materials Project è stata una svolta per i nostri utenti. Ha abilitato un intero nuovo ecosistema di strumenti e integrazioni che rendono più facile che mai accedere e analizzare i nostri dati, dai notebook Jupyter e applicazioni web alle pipeline di screening ad alta produttività.”

NOMAD Archive, un archivio per dati grezzi da simulazioni di materiali ad alta produttività, è un altro adottante precoce di OPTIMADE. Esponendo i suoi dati tramite un’API OPTIMADE, NOMAD ha consentito ai ricercatori di effettuare data mining su larga scala e addestrare modelli di machine learning su un enorme dataset di proprietà calcolate.

Secondo il Dott. Luca Ghiringhelli, capo gruppo al Fritz Haber Institute e appassionato di AI nella scienza dei materiali:

“Stiamo assistendo a un vero aumento di interesse nella ricerca sui materiali guidata dai dati, e OPTIMADE sta giocando un ruolo chiave in questo. Fornendo un’interfaccia unica a più database, sta abbassando le barriere all’accesso e all’integrazione dei dati e contribuendo a democratizzare il settore.”

Applicazioni Reali

L’impatto di OPTIMADE è già visibile in molti settori della ricerca sui materiali, dalle batterie e l’energia rinnovabile all’aerospazio e all’ingegneria biomedica. Ecco alcuni esempi di come ciò stia avvenendo:

#1. Trovare termoelettrici ad alte prestazioni: Ricercatori della Northwestern University hanno utilizzato OPTIMADE per combinare dati da più database computazionali, inclusi il Materials Project e OQMD, per addestrare un modello di machine learning volto a prevedere le proprietà termoelettriche di nuovi materiali. Utilizzando questo dataset, sono riusciti a individuare diversi nuovi composti con potenziali prestazioni record, che ora vengono sintetizzati e testati.

#2. Screening ad alta produttività di materiali 2D: Un team della Technical University of Denmark ha utilizzato OPTIMADE per esaminare più di 50.000 materiali 2D computazionali dal Computational 2D Materials Database (C2DB). Interrogando il database con filtri OPTIMADE, hanno potuto trovare rapidamente materiali con proprietà specifiche, come alta mobilità di carica o basso gap di banda, per l’elettronica e l’optoelettronica di nuova generazione.

#3. Lo sviluppo rapido di nuovi materiali per batterie: Ricercatori del MIT e della Stanford University hanno utilizzato OPTIMADE per creare un database centralizzato delle proprietà dei materiali per batterie, combinando dati dal Materials Project, OQMD e altre fonti. Hanno addestrato una serie di modelli di machine learning su questo dataset per prevedere metriche chiave di prestazione, come capacità e ciclicità, per nuove chimiche di batterie al litio. Questi modelli sono ora utilizzati per guidare gli sforzi sperimentali allo sviluppo di batterie più sicure, più durature e con maggiore densità energetica per veicoli elettrici e stoccaggio di rete.

#4. Progettazione di leghe ad alta entropia: Un team dell’University of Maryland ha utilizzato OPTIMADE per combinare dati da più database computazionali ed esperimentali, inclusi il Materials Project, OQMD e il High-Entropy Alloys Database (THEAD), per costruire un dataset delle proprietà delle leghe ad alta entropia. Hanno usato questo dataset per addestrare un modello di machine learning volto a prevedere le energie di formazione e le stabilità di fase di nuove composizioni di leghe ad alta entropia. Sono riusciti a selezionare migliaia di candidati e a trovare i più promettenti per la validazione sperimentale. Questo lavoro sta contribuendo ad accelerare lo sviluppo di leghe ad alta entropia di nuova generazione con forza, tenacità e resistenza alla corrosione eccezionali per l’aerospazio, la difesa e oltre.

Ora, esaminiamo quali aziende possono trarre il massimo beneficio dall’adozione di questi standard.

#1. Tesla (TSLA)

Tesla, Inc. trarrà enormi benefici dallo scambio di dati standardizzato di OPTIMADE, che migliorerà la sua capacità di sviluppare tecnologie per batterie migliori e ottimizzare i materiali nei suoi processi di produzione. Questo aiuterà Tesla a creare batterie con maggiore densità energetica, cicli di vita più lunghi e caratteristiche di sicurezza migliorate, riducendo al contempo i costi e migliorando la sostenibilità.

(TSLA )

Dal punto di vista finanziario, nel 2023 Tesla ha registrato un fatturato di 96,8 miliardi di dollari, con un aumento del 19% rispetto all’anno precedente, dimostrando una forte crescita finanziaria e un potenziale per un’innovazione continua.​

#2. Intel Corporation (INTC)

Un’altra azienda che trarrà notevoli benefici dallo scambio di dati standardizzato di OPTIMADE è Intel Corporation (INTC), leader nei settori della tecnologia e dei semiconduttori. Sfruttando l’AI e i dati dei materiali standardizzati, Intel può scoprire e progettare nuovi materiali semiconduttori, portando allo sviluppo di chip con prestazioni migliori, maggiore efficienza e nuove funzionalità.

Ciò aiuterà Intel a mantenere la sua posizione all’avanguardia dell’innovazione nei semiconduttori. Inoltre, l’integrazione dei dati provenienti da vari database semplificherà i processi di ricerca e sviluppo di Intel, consentendo di concentrarsi maggiormente sull’innovazione e meno sulla gestione dei dati.

(INTC )

Sul versante finanziario, Intel ha registrato un fatturato di 54,2 miliardi di dollari nel 2023, riflettendo il ruolo significativo dell’azienda nel settore e il suo continuo potenziale di crescita e sviluppo.

Il Futuro di OPTIMADE

Man mano che OPTIMADE viene adottato sempre più, la comunità della scienza dei materiali sta esplorando nuove frontiere dell’integrazione e della scoperta dei dati. Un’area di sviluppo è l’integrazione di OPTIMADE con altri standard e ontologie dei dati, come l’European Materials Modelling Ontology (EMMO) e il Crystallographic Information Framework (CIF).

Allineare questi diversi standard e semantiche consentirà ai ricercatori di porre domande ancora più potenti e complesse attraverso molteplici fonti di dati, lunghezze, scale temporali e domini della scienza dei materiali.

Un’altra area di interesse per la ricerca futura è lo sviluppo di strumenti più avanzati e automatizzati per l’analisi dei dati dei materiali e il machine learning. L’ascesa di tecniche di deep learning come le reti neurali grafiche e le architetture transformer indica la necessità di metodi sia standardizzati che scalabili per rappresentare e processare i dati dei materiali in questi modelli.

OPTIMADE è ben posizionata per svolgere un ruolo chiave in questo ambito poiché può fornire un’interfaccia comune per accedere e integrare grandi e diversi dataset di proprietà e strutture dei materiali. Come afferma il Dott. Matthias Scheffler, direttore del Fritz Haber Institute e pioniere nella scienza computazionale dei materiali:

“OPTIMADE non riguarda solo la maggiore accessibilità dei dati, ma l’abilitazione di nuovi paradigmi per la scoperta e la progettazione dei materiali. Fornendo una base per la ricerca sui materiali guidata dai dati e dall’AI, stiamo contribuendo a inaugurare una nuova era di innovazione e scoperta.”

Guardando più avanti, c’è anche interesse nell’utilizzare OPTIMADE per abilitare modelli più decentralizzati e collaborativi di condivisione dei dati e scoperta dei materiali. Ad esempio, alcuni ricercatori stanno esplorando l’uso della blockchain per creare reti sicure e distribuite di database OPTIMADE dove i dati possono essere condivisi e interrogati tra più istituzioni e domini.

Altri stanno valutando il federated learning per addestrare modelli di machine learning su dataset decentralizzati senza la necessità di centralizzare o armonizzare i dati. Consentendo ai ricercatori di aziende come Matgenix e Data Science OÜ di collaborare e condividere intuizioni oltre i confini istituzionali mantenendo il controllo sui propri dati e sulla proprietà intellettuale, questi approcci potrebbero accelerare il ritmo della scoperta e dell’innovazione dei materiali.

Clicca qui per scoprire perché l’intelligenza artificiale è un’opportunità da un miliardo di dollari per Cisco Systems.

Considerazioni Conclusive

L’AI e le tecniche guidate dai dati nella scienza dei materiali stanno cambiando il modo in cui scopriamo, progettiamo e impieghiamo nuovi materiali. Ma per realizzare pienamente questi approcci, è necessaria un’infrastruttura robusta e standardizzata per accedere e integrare i dati da più fonti e domini.

L’API OPTIMADE è un fattore abilitante fondamentale per questo, fornendo un linguaggio e un protocollo comuni per interrogare e recuperare dati sui materiali in un formato leggibile dalla macchina. Riducendo le barriere all’accesso e all’integrazione dei dati, OPTIMADE rende la ricerca sui materiali più democratica e accelera l’innovazione.

Man mano che OPTIMADE viene adottato sempre più e emergono nuovi strumenti e tecniche per la scoperta di materiali guidata dai dati, possiamo aspettarci ancora di più in futuro. Dai nuovi materiali per batterie e leghe ad alte prestazioni a farmaci personalizzati e nanomateriali funzionali, le possibilità sono infinite.

Ma per realizzare ciò, è necessario un investimento sostenuto e una collaborazione all’interno della comunità della scienza dei materiali, nonché dati aperti, standard aperti e scienza aperta. Solo lavorando insieme oltre i confini disciplinari e istituzionali possiamo sperare di liberare il pieno potere dell’AI e della scoperta guidata dai dati nella scienza dei materiali.

Come afferma il Dott. Gerbrand Ceder, professore di scienza dei materiali presso UC Berkeley e pioniere della progettazione computazionale dei materiali:

“Il futuro è promettente, ma dobbiamo cambiare il modo in cui pensiamo ai dati e alla collaborazione. Utilizzando standard aperti come OPTIMADE e lavorando insieme come comunità per condividere conoscenze, possiamo accelerare l’innovazione e risolvere alcuni dei più grandi problemi che affrontiamo oggi.”

In generale, l’adozione di standard come OPTIMADE rivoluzionerà la scienza dei materiali semplificando l’integrazione dei dati, migliorando la collaborazione e guidando un’innovazione rapida in molteplici settori.

Clicca qui per scoprire tutto sull’investire nell’intelligenza artificiale (AI). 

Gaurav ha iniziato a negoziare criptovalute nel 2017 e da allora si è innamorato dello spazio crypto. Il suo interesse per tutto ciò che riguarda le criptovalute lo ha trasformato in uno scrittore specializzato in criptovalute e blockchain. Presto si è trovato a lavorare con aziende di criptovalute e testate giornalistiche. È anche un grande fan di Batman.