Instituto Laude lanza primera cohorte de subvenciones de inteligencia artificial Slingshots

Laude Institute announces first batch of ‘Slingshots’ AI grants

Puntos clave

  • El Instituto Laude lanza la primera cohorte de subvenciones de inteligencia artificial Slingshots.
  • Quince proyectos reciben financiamiento, potencia de cálculo y soporte de ingeniería.
  • Las subvenciones se centran en avanzar en las benchmarks de evaluación de la inteligencia artificial.
  • Proyectos incluidos: Terminal Bench, ARC-AGI, Formula Code, BizBench.
  • John Boda Yang lidera CodeClash, una evaluación de código basada en la competencia.
  • Los receptores deben entregar resultados tangibles, como startups o herramientas de código abierto.
  • El instituto advierte en contra de que las benchmarks se vuelvan demasiado específicas de las empresas.

El Instituto Laude anunció su programa inaugural de subvenciones Slingshots, que proporciona financiamiento, potencia de cálculo y soporte de producto a 15 proyectos de investigación de inteligencia artificial enfocados en la evaluación. La cohorte incluye iniciativas como la benchmark de codificación Terminal Bench, un proyecto ARC-AGI actualizado, Formula Code de Caltech y UT Austin, y BizBench de Columbia. El co-fundador de SWE-Bench, John Boda Yang, lidera el nuevo marco de competencia CodeClash. Se espera que los receptores entreguen resultados tangibles como startups o bases de código de código abierto, mientras que el instituto advierte en contra de que las benchmarks se vuelvan demasiado específicas de las empresas.

Descripción general del programa

El Instituto Laude presentó su primera tanda de subvenciones Slingshots, un nuevo acelerador diseñado para avanzar en la ciencia y la práctica de la inteligencia artificial. El programa proporciona recursos que a menudo no están disponibles en entornos académicos típicos, incluyendo financiamiento, potencia de cálculo y soporte de producto e ingeniería. A cambio, los receptores de las subvenciones se comprometen a producir un producto de trabajo concreto, como una startup, una base de código de código abierto o otro tipo de artefacto.

Composición y enfoque de la cohorte

La cohorte inaugural consiste en quince proyectos, con un énfasis particular en la evaluación de la inteligencia artificial. Los proyectos notables incluyen Terminal Bench, una benchmark de codificación de línea de comandos, y la última versión del proyecto ARC-AGI de larga duración. Formula Code, una colaboración entre investigadores de Caltech y la Universidad de Texas en Austin, tiene como objetivo evaluar la capacidad de los agentes de inteligencia artificial para optimizar el código existente. De la Universidad de Columbia, BizBench propone una benchmark integral para "agentes de inteligencia artificial de cuello blanco". Las subvenciones adicionales exploran estructuras novedosas para el aprendizaje de refuerzo y la compresión de modelos.

CodeClash y preocupaciones de la industria

El co-fundador de SWE-Bench, John Boda Yang, es parte de la cohorte, liderando el nuevo proyecto CodeClash. CodeClash evalúa el código a través de un marco dinámico y basado en la competencia, buscando impulsar el progreso manteniendo las benchmarks relevantes y desafiantes. Yang expresó su preocupación de que las benchmarks puedan volverse demasiado específicas de las empresas individuales, enfatizando la necesidad de estándares de evaluación abiertos y más amplios.

#Instituto Laude#Slingshots#subvenciones de inteligencia artificial#evaluación de inteligencia artificial#Terminal Bench#ARC-AGI#Formula Code#Caltech#UT Austin#BizBench#Universidad de Columbia#SWE-Bench#John Boda Yang#CodeClash

También disponible en: