#Research Fuente de datos, dataset y datasource

 

Les acerco la recopilación de diferentes fuentes de datos públicas, datasets y datasources que podrán ser de utilidad en las investigaciones que realicen en sus actividades de ciencia de datos, inteligencia del negocio y análisis empresarial.

  Última actualización 31/03/2023  


Google Dataset Search: Búsqueda de Datasets es un motor de búsqueda de conjuntos de datos. Los usuarios pueden descubrir conjuntos de datos alojados en miles de repositorios de toda la Web mediante una simple búsqueda con palabras clave. | Video explicativo como usar Google Dataset https://www.youtube.com/watch?v=O2gbeTh9Ol8 

Google News Initiative: Un paquete completo de herramientas de gestión de datos, analíticas y aprendizaje automático para generar información valiosa y extraer valor de los datos. 

Open Data on AWS: Este registro existe para ayudar a las personas a descubrir y compartir conjuntos de datos que están disponibles a través de los recursos de AWS.

Amazon Public DataSets: Conjuntos de datos públicos en AWS: repositorio centralizado de conjuntos de datos públicos que se pueden integrar sin problemas en las aplicaciones basadas en la nube de AWS.

Azure Open Datasets - Facilidad de acceso a datos abiertos seleccionados en Azure: Mejore la precisión de los modelos de aprendizaje automático con conjuntos de datos disponibles públicamente. Ahorre tiempo en la detección y preparación de datos mediante conjuntos de datos mantenidos que están listos para usarse en flujos de trabajo de aprendizaje automático y a los que puede acceder fácilmente desde los servicios de Azure. 

Yahoo Datasets: Tenemos varios tipos de datos disponibles para compartir. Se clasifican en calificaciones, idioma, gráfico, publicidad y datos de mercado, sistemas informáticos y un apéndice de otros datos y recursos relevantes disponibles a través de Yahoo! Red de desarrolladores.

GeeksforGeeks: Tutoriales gratuitos, millones de artículos, cursos en vivo, en línea y presenciales, competencias de codificación frecuentes, seminarios web de expertos de la industria, oportunidades de pasantías y oportunidades laborales. 

Kaggle - DataSet: Explore, analice y comparta datos de calidad. Obtenga más información sobre los tipos de datos, la creación y la colaboración. | Video de cómo usar Kaggle.   

Peter Diamandis - Evidence of Abundance: Esta página incluye tablas y gráficos que puede compartir con amigos y familiares para cambiar su forma de pensar. Realmente estamos viviendo en el momento más emocionante para estar vivos. Alrededor de 80 gráficos que muestran evidencia muy sólida de que el mundo está mejorando. En los últimos cinco años, esta tendencia ha continuado y acelerado.

Stanford Large Network Dataset Collection: Una colección de alrededor de 50 grandes conjuntos de datos de red desde decenas de miles de nodos y bordes hasta decenas de millones de nodos y bordes. Incluye redes sociales, gráficos web, redes de carreteras, redes de Internet, redes de citas, redes de colaboración y redes de comunicación.

Pew Research Center - Tools & Resources: Herramientas y recursos digitales para acceder a los datos del Pew Research Center. 

Pew Global Attitudes & Trends Question Database: La base de datos de preguntas de tendencias y actitudes globales de Pew incluye preguntas de encuestas de todas las encuestas de actitudes globales de Pew desde 1999. Para buscar una pregunta, ingrese cualquier palabra clave o combinación de palabras y/o seleccione un país o estudio de interés. 

Free Code Camp: Estas son las mejores fuentes de datos abiertas gratuitas que cualquiera puede usar.

ABC News - FiveThirtyEight: Estamos compartiendo los datos y el código detrás de algunos de nuestros artículos y gráficos. Esperamos que lo utilice para comprobar nuestro trabajo y crear sus propias historias y visualizaciones.

Data Commons: Los datos disponibles públicamente de fuentes abiertas (census.gov, cdc.gov, data.gov, etc.) son recursos vitales para estudiantes e investigadores en una variedad de disciplinas. Combinar datos de diferentes fuentes requiere mapear entidades comunes (ciudad, condado, etc.) y resolver diferentes tipos de claves/identificadores. Este proceso requiere mucho tiempo, es tedioso y se realiza una y otra vez. Nuestro objetivo con Data Commons es abordar este problema. Data Commons sintetiza un solo gráfico a partir de estas diferentes fuentes de datos. Vincula referencias a las mismas entidades (como ciudades, condados, organizaciones, etc.) en diferentes conjuntos de datos a nodos en el gráfico, de modo que los usuarios puedan acceder a datos sobre una entidad en particular agregados de diferentes fuentes sin necesidad de limpiar o unir datos. Esperamos que los datos contenidos en Data Commons sean útiles para estudiantes, investigadores y entusiastas de diferentes disciplinas.

Latinometrics: Visualizando el potencial latinométrico de América Latina es un esfuerzo conjunto de Ernesto Canales y Mario Canales para llenar el vacío de información basada en datos en nuestra región. Cada semana, le traemos las ideas más interesantes y subestimadas sobre América Latina en un formato conciso y digerible. Referencias: Substack - Twitter - Linkedin.

Datos Argentina | Datos Argentina DataSets: Ponemos a tu alcance datos públicos en formatos abiertos para que puedas usarlos, modificarlos y compartirlos. Estos datos son tuyos. Podés crear visualizaciones, aplicaciones y grandes herramientas con ellos.

Datos Argentina - Ciudad de Buenos Aires: Encontrá todos los datos del Gobierno de la Ciudad en un sólo lugar. Descargalos, analizalos y compartilos. Conocé más la Ciudad. 

Datos España - Reutiliza la información pública: La Iniciativa Aporta arranca en 2009 con el fin de promocionar la apertura de la información pública y desarrollo de servicios avanzados basados en datos. Es promovida por el Ministerio de Asuntos Económicos y Transformación Digital y la Entidad Pública Empresarial Red.es.

Datos Estados Unidos - Data.Gov: El catálogo de Data.gov brinda la capacidad de buscar y examinar conjuntos de datos, series de datos, herramientas y productos. Data.gov reúne datos de cientos de fuentes , incluido el gobierno federal, ciudades, condados, estados y universidades. Todas las organizaciones contribuyentes se enumeran en " Organizaciones " en la parte superior derecha.

Datos Europa: Data.europa.eu - El portal oficial de datos europeos.

Our World in Data: Pobreza, enfermedad, hambre, cambio climático, guerra, riesgos existenciales y desigualdad: el mundo enfrenta muchos problemas grandes y aterradores. Son estos grandes problemas en los que se centra nuestro trabajo en Our World in Data. El objetivo de nuestro trabajo es hacer accesible y comprensible el conocimiento sobre los grandes problemas. Como decimos en nuestra página de inicio , la misión de Our World in Data es publicar la "investigación y los datos para avanzar contra los problemas más grandes del mundo".

World Bank: DataBank es una herramienta de análisis y visualización que contiene colecciones de datos de series temporales sobre una variedad de temas.

Banco Mundial: Datos de libre acceso del Banco Mundial. Acceso abierto y gratuito a datos sobre el desarrollo en el mundo. 

Naciones Unidas: Los datos de la ONU,  es un servicio de datos basado en la web para la comunidad mundial de usuarios. Pone las bases de datos estadísticas internacionales al alcance de los usuarios a través de un único punto de entrada. Los usuarios pueden buscar y descargar una variedad de recursos estadísticos compilados por el sistema estadístico de las Naciones Unidas (ONU) y otras agencias internacionales. Las numerosas bases de datos o tablas conocidas colectivamente como "datamarts" contienen más de 60 millones de puntos de datos y cubren una amplia gama de temas estadísticos que incluyen agricultura, delincuencia, comunicación, asistencia para el desarrollo, educación, energía, medio ambiente, finanzas, género, salud, mercado laboral, manufactura, cuentas nacionales, población y migración, ciencia y tecnología, turismo, transporte y comercio.

UNESCO Institute for Statistics (UIS): es la fuente oficial y confiable de datos comparables internacionalmente sobre educación, ciencia, cultura y comunicación. Como agencia estadística oficial de la UNESCO, el UIS produce una amplia gama de bases de datos de última generación para impulsar las políticas y las inversiones necesarias para transformar vidas e impulsar al mundo hacia sus objetivos de desarrollo. El UIS proporciona acceso gratuito a los datos de todos los países de la UNESCO y grupos regionales desde 1970 hasta el año más reciente disponible. El UIS alienta a los desarrolladores e investigadores a crear sitios web y aplicaciones que aprovechen los datos de difusión del UIS. Además de una potente API basada en estándares, el UIS admite un navegador de datos y un servicio de descarga de datos masivos (BDDS).

Stack Exchange: Open Data Stack Exchange es un sitio de preguntas y respuestas para desarrolladores e investigadores interesados ​​en datos abiertos.

Viz For Social Good: Conectando a los entusiastas de los datos con organizaciones impulsadas por una misión. Nuestra comunidad de voluntarios ayuda a las organizaciones impulsadas por una misión a crear un cambio social a través de la visualización de datos y la narración de historias. Nuestros voluntarios crean visualizaciones de datos informativas e impactantes para organizaciones impulsadas por una misión en todo el mundo. 

Data Science Dojo - DataSets para mejorar tus habilidades en ciencia de datos: El repositorio incluye una amplia gama de temas, niveles de dificultad, tamaños y atributos. Los conjuntos de datos se clasifican según diferentes niveles de dificultad para que sean adecuados para todos.

GapMinder: Los conjuntos de datos completos con cientos de indicadores están disponibles en los repositorios de Github. Gapminder combina datos de múltiples fuentes en series de tiempo únicas y coherentes que no se pueden encontrar en ningún otro lugar.

Nasdaq Data Link: Una fuente principal de conjuntos de datos financieros, económicos y alternativos. 

World Health Data Hub (World Health Organization): El World Health Data Hub de la OMS (Organización Mundial de la Salud) es una plataforma digital integral para datos de salud mundial. Proporciona soluciones integrales para recopilar, almacenar, analizar y compartir datos que son oportunos, confiables y procesables.

Global Biodiversity Information Facility (GBIF): Acceso libre y abierto a los datos de biodiversidad. GBIF es una red internacional e infraestructura de datos financiada por los gobiernos del mundo y destinada a proporcionar a cualquier persona, en cualquier lugar, acceso abierto a datos sobre todos los tipos de vida en la Tierra.

NASA's Open Data Portal: DATA.NASA.GOV es el sitio de intercambio de información de la NASA para datos abiertos proporcionados al público. Decenas de miles de conjuntos de datos están disponibles para usted. La mayoría de las páginas de conjuntos de datos en data.nasa.gov solo contienen metadatos para cada conjunto de datos. Es común que los datos reales se mantengan en otros sitios de archivo de la NASA. Data.nasa.gov tendrá los metadatos y los enlaces a los datos tal como existen en esos muchos otros lugares.

Statista - decisiones más rápidas e inteligentes: Statista es la plataforma de datos empresariales número uno del mundo y proporciona datos de mercado y de consumo sobre más de 80 000 temas de 170 sectores y 150 países y regiones.

Chartr - Narración de datos: Información basada en datos sobre negocios , tecnología, entretenimiento y sociedad . Nuestro boletín visual tarda 5 minutos en leerse y es completamente gratuito. Obtenga las imágenes y los datos que necesita para comprender el mundo actual y lleve su pequeña charla al siguiente nivel, en la oficina y en el hogar.


DataSets para seguir investigando

26 Data Analytics Project Ideas and Datasets (2022): Los proyectos de análisis de datos lo ayudan a crear su cartera y conseguir entrevistas. Sin embargo, no basta con hacer un proyecto de análisis interesante. También debe comercializar su proyecto para asegurarse de que lo encuentren.

Medium - Los 100 mejores conjuntos de datos de código abierto para ciencia de datos: Conjuntos de datos para categorías: visión artificial, PNL, aprendizaje por refuerzo, aprendizaje profundo, etc.

Analytics Vidhya - Los 10 mejores sitios web de ciencia de datos para encontrar conjuntos de datos para su próximo proyecto de DS: ¿Qué tienen de sorprendente estos sitios web? frecen datos sin costo en la mayoría de los casos. También proporcionaré los enlaces a estos sitios web en este artículo. Por lo tanto, manténgase en sintonía con nosotros y lea el artículo completo para repasar sus habilidades en los conjuntos de datos disponibles en las plataformas para que pueda prepararse para el trabajo.

iMerit - 25 conjuntos de datos abiertos para proyectos de ciencia de datos: En iMerit, trabajamos constantemente con algunas de las mentes más brillantes del mundo. Si está trabajando en un proyecto de ciencia de datos y se encuentra en la búsqueda de conjuntos de datos, no busque más allá de esta lista que hemos compilado en función de los éxitos de nuestros clientes. En esta lista, encontrará conjuntos de datos altamente seleccionados que se crearon para regresión lineal, tareas de clasificación simples y análisis predictivo.

BigData Magazine: Algunos profesionales recomiendan comenzar a utilizar estos conjuntos de datos gratuitos para empezar a aprender a analizar datos, crear visualizaciones de datos o simplemente mejorar las habilidades de alfabetización de datos. 

Sitio BigData - Los mejores datasets para aprendizaje automático: Incluye enlaces sobre Buscadores de Datasets para Aprendizaje Automático, Datasets del Gobierno Público, Datasets de Finanzas y Economía, Datasets de Computer Vision, Datasets de Análisis de Sentimiento, Datasets de Procesamiento del Lenguaje Natural (NPL), Datasets de Auto-Conducción (Conducción Autónoma o self driving), Datasets Clínicos, Datasets de Sistemas de Recomendación. 

El Estado del Arte de los Datos Abiertos 2022: Basado en una encuesta global, el informe se encuentra ahora en su séptimo año y proporciona información sobre las actitudes y experiencias de los investigadores con respecto a los datos abiertos. Con más de 5400 encuestados, la encuesta de 2022 es la más grande desde que comenzó la pandemia de COVID-19. El informe de este año también incluye artículos invitados de expertos en datos abiertos de los Institutos Nacionales de Salud (NIH), la Oficina de Política Científica y Tecnológica (OSTP) de la Casa Blanca, el Centro de Información de Redes Informáticas, la Academia China de Ciencias (CNIC, CAS), editoriales y universidades.

32 conjuntos de datos para mejorar tus habilidades en ciencia de datos: Data Science Dojo ha creado un archivo de 32 conjuntos de datos para que practique y mejore sus habilidades como científico de datos. el repositorio incluye una amplia gama de temas, niveles de dificultad, tamaños y atributos. Los conjuntos de datos se clasifican según diferentes niveles de dificultad para que sean adecuados para todos.



No hay comentarios.

Imágenes del tema de Petrovich9. Con tecnología de Blogger.