Feb 27 2011

Sistema OpenSource di Data Mining e Data Warehousing

Category: TecnologiaAntonio @ 14:54


Conoscere gli utenti che navigano una rete civica è indispensabile per prendere decisioni e migliorare il servizio offerto all’utenza cittadina.

Il progetto ht://Miner, totalmente sviluppato dal Comune di Prato all’interno della Rete Civica provinciale pratese Po-Net e distribuito liberamente secondo la licenza GNU GPL, si inquadra in questo contesto. L’ambizioso progetto prevede la creazione di un sistema completo di web usage mining e di data warehousing che, partendo dai semplici access log prodotti in modo automatico dai vari server web, permetta la scoperta di informazioni e la memorizzazione delle stesse in un archivio PostgreSQL organizzato su due livelli: un data46 operazionale ed un data warehouse.

Il progetto ht://Miner è una suite di applicazioni scritte in C++, Perl e PHP che intervengono ai vari stadi del processo di scoperta di conoscenza, tipico dei sistemi di KDD (knowledge discovery from data) e di data mining. Il software utilizza in modo prevalente tecnologia open-source, in particolare sistemi operativi (GNU/Linux o FreeBSD), DBMS relazionali (PostgreSQL), linguaggi di programmazione (PHP, Perl), strumenti di sviluppo GNU (in particolare GCC, autotools e Gettext).

Il progetto ht://Miner è l’ultimo tassello dell’esperienza pluriennale del Comune di Prato nello sviluppo attivo di software open-source. Sulla 46 delle direttive nazionali, regionali e comunali in materia di diffusione del software libero, uno degli obiettivi principali dell’ente è quello di promuovere il riuso delle tecnologie e degli applicativi con le altre realtà della Pubblica Amministrazione italiana, mettendo a disposizione l’esperienza maturata nel settore.

Il software ht://Miner rappresenta un esempio di applicazione verticale open-source interamente sviluppata dal Comune di Prato a partire da un progetto sperimentale intrapreso nel 2003. Il progetto si inquadra nel contesto della rete civica provinciale pratese Po-Net, una delle realtà più complesse, eterogenee e al contempo avanzate della pubblica amministrazione italiana su Internet: vi partecipano tutti i Comuni del territorio pratese, la Provincia, la Camera di Commercio, l’Azienda Sanitaria Locale, le aziende a partecipazione pubblica e poi biblioteche, musei, istituzioni culturali, scuole e associazioni. I gruppi di lavoro e le redazioni di Po-Net sono circa 140. Gli accessi alle pagine della rete civica registrati nel 2006 sono stati circa 37 milioni.

 

Tag: , , ,

Commenti chiusi.