La ubicuidad de los espacios de almacenamiento de datos digitales y la facilidad de adquisición y generación de nuevos datos, a través de teléfonos inteligentes, tabletas, cámaras integradas, cámaras de vigilancia estacionarias, sistemas de seguimiento de tipo GPS, una tarjeta Vitale, sistemas de imágenes médicas, etc., permiten a todos y a los organismos públicos almacenar una cantidad fenomenal de datos, como lo demuestran las bibliotecas digitales cargadas con fotos y vídeos personales, la información almacenada en las redes sociales o los portales de datos abiertos recientemente puestos a disposición por las regiones y el Estado francés. Los datos típicamente generados y almacenados pueden ser heterogéneos y variados: por ejemplo, pueden relacionarse con imágenes de los pulmones de un paciente con una enfermedad, con los hábitos de compra de los clientes de una tienda, o con la renovación de marcas en las carreteras del departamento de Eure.El conjunto de estos datos forma una riqueza que es necesario explorar, limpiar e interpretar para generar conocimiento. Como también se destaca en el informe de 2011 de Mc Kinsey, esta capacidad de extraer conocimientos de los datos será a muy corto plazo, y durante mucho tiempo, un vehículo para la innovación y la riqueza. Como resultado, los descubrimientos científicos obtenidos a través del análisis de datos están aumentando y participan en varios campos disciplinarios como la biología, la salud, las humanidades y las ciencias sociales. ... En este contexto, la ciencia de los datos es la fuerza motriz central de estas investigaciones e innovaciones, y las cuestiones científicas abordadas en ellas abordan los problemas de adquisición, almacenamiento, indexación, modelización y análisis. Entre las cuestiones difíciles se encuentra la integración de estos datos complejos, heterogéneos e interdependientes para generar conocimientos, contribuir a la toma de decisiones o generar valor. La región de Alta Normandía y todos los actores institucionales de la región, plenamente conscientes de la importancia del sector digital, multiplican sus actividades de desarrollo y apoyo a los actores y emprendedores locales, generando o procesando datos digitales; por ejemplo, la creación de Seine Innopolis y la cantina digital. Para aprovechar estos datos, es de suma importancia iniciar una estructuración de las actividades locales relacionadas con el análisis de datos y la ciencia. El proyecto que proponemos aquí es una oportunidad única para lanzar y federar actividades en torno a este tema.El proyecto DAISI tiene como objetivo estructurar algunos de los trabajos realizados en ciencia de datos y con la participación de diversos actores de alto nivel (ver lista de socios a continuación). Su objetivo es unir las fortalezas y medios adquiridos e implementados por estos actores con el fin de fortalecer las capacidades existentes, crear nuevos campos de investigación nacidos de la fertilización cruzada de campos científicos particulares y de la ciencia de los datos, y finalmente animar a los actores a producir resultados científicos de importancia internacional desde sus aspectos innovadores. Desde el punto de vista científico, su objetivo es desarrollar métodos e instrumentos innovadores para analizar grandes cantidades de datos, extraer información y conocimientos útiles para diferentes ámbitos disciplinarios como la salud, el entorno urbano y el análisis del tráfico urbano. Desde este punto de vista, DAISI es, por lo tanto, un proyecto de investigación preliminar guiado por aplicaciones de alto impacto social.