Kaggle
Kaggle, una subsidiaria de Google LLC, es una comunidad en línea de científicos de datos y profesionales del aprendizaje automático. Kaggle permite a los usuarios encontrar y publicar conjuntos de datos, explorar y crear modelos en un entorno de ciencia de datos basado en la web; trabajar con otros científicos de datos e ingenieros de aprendizaje automático y participar en concursos para resolver desafíos de ciencia de datos.[1] HistoriaKaggle comenzó en 2010 ofreciendo concursos de aprendizaje automático y ahora también ofrece una plataforma de datos públicos, un banco de trabajo basado en la nube para ciencia de datos y educación en inteligencia artificial. Su personal inicial clave fueron Anthony Goldbloom y Jeremy Howard. Nicholas Gruen fue presidente fundador, sucedido por Max Levchin. El patrimonio en 2011 se elevó llegando a valorar la empresa en $ 25 millones de dólares norteamericanos. El 8 de marzo de 2017, Fei-Fei Li, científica jefe de Google, anunció que la empresa iba a adquirir Kaggle.[2][3] En junio de 2017, Kaggle superó el millón de usuarios registrados y, en octubre de 2023, tenía más de 15 millones de usuarios en 194 países.[4][5][6] En 2022, los fundadores Goldbloom y Hamner dimitieron de sus cargos y D. Sculley se convirtió en director ejecutivo.[7] En febrero de 2023, Kaggle presentó Models, que permite a los usuarios descubrir y utilizar modelos previamente entrenados a través de integraciones profundas con el resto de la plataforma de Kaggle.[8] Comunidad de KaggleEn junio de 2017, Kaggle anunció que superó el millón de usuarios registrados, o Kagglers.[9] La comunidad se extiende por 194 países. Es una comunidad diversa, que va desde aquellos que recién comienzan hasta muchos de los investigadores más conocidos del mundo.[10] Las competiciones de Kaggle atraen regularmente a más de mil equipos e individuos. La comunidad de Kaggle tiene miles de conjuntos de datos públicos y fragmentos de código (llamados «Kaggle kernels» en Kaggle). Muchos de estos investigadores publican artículos en revistas revisadas por pares basándose en su desempeño en las competencias de Kaggle.[11] En marzo de 2017, el fondo Two Sigma Investments estaba realizando una competencia en Kaggle para codificar un algoritmo de compra y venta de activos.[12] Servicios de Kaggle
Cómo funcionan las competiciones de Kaggle
Además de sus competencias públicas, Kaggle también ofrece competencias privadas limitadas a los principales participantes de Kaggle. Kaggle ofrece una herramienta gratuita para que los profesores de ciencia de datos realicen concursos académicos de aprendizaje automático, Kaggle In Class.[14] Kaggle también organiza concursos de reclutamiento en los que los científicos de datos compiten por la oportunidad de entrevistarse en empresas líderes en ciencia de datos como Facebook, Winton Capital y Walmart. Impacto de las competiciones de KaggleKaggle ha realizado cientos de concursos de aprendizaje automático desde que se fundó la empresa. Las competiciones van desde mejorar el reconocimiento de gestos para Microsoft Kinect[15] hasta hacer una IA de fútbol para el Manchester City o mejorar la búsqueda del bosón de Higgs en el CERN.[16] Las competiciones han dado lugar a muchos proyectos exitosos que incluyen la mejora del estado del arte en la investigación del VIH,[17] calificaciones de ajedrez[18] y pronósticos de tráfico.[19] Los más famosos, Geoffrey Hinton y George Dahl, usaron redes neuronales profundas para ganar una competencia organizada por Merck. Y Vlad Mnih (uno de los estudiantes de Hinton) usó redes neuronales profundas para ganar una competencia organizada por Adzuna. Esto ayudó a mostrar el poder de las redes neuronales profundas y resultó en que la técnica fuera adoptada por otros en la comunidad de Kaggle. Tianqi Chen de la Universidad de Washington también usó Kaggle para mostrar el poder de XGBoost, que desde entonces ha reemplazado a Random Forest como uno de los principales métodos utilizados para ganar competencias de Kaggle. Se han publicado varios artículos académicos sobre la base de los hallazgos realizados en los concursos de Kaggle.[20] Una clave para esto es el efecto de la tabla de clasificación en vivo, que anima a los participantes a seguir innovando más allá de las mejores prácticas existentes.[21] Los métodos ganadores se escriben con frecuencia en el blog de Kaggle. FinanzasEn marzo de 2017, Fei-Fei Li, directora científica de Google, anunció que Google iba a adquirir Kaggle durante su discurso de apertura en Google Next.[22] Sistema de ProgresiónKaggle ha implementado un sistema de progresión para reconocer y recompensar a los usuarios en función de sus contribuciones y logros dentro de la plataforma. Este sistema consta de cinco niveles: Novato, Colaborador, Experto, Maestro y Gran Maestro. Cada nivel se alcanza cumpliendo con un conjunto de criterios específicos en competiciones, conjuntos de datos, kernels (compartición de código) y discusiones.[23] El nivel más alto que se puede lograr, Gran Maestro de Kaggle, se otorga a los usuarios que han obtenido un alto rango en múltiples competiciones, incluyendo un alto desempeño en equipos individuales. El 28 de mayo de 2024, de los 18,5 millones de cuentas en Kaggle, 2.745 han alcanzado el estatus de Maestro y 530 han alcanzado el estatus de Gran Maestro.[24]
Referencias
Otras lecturas
Enlaces externos |