https://github.com/datos-fundar/sesgos_llm
¿Cómo “se equivocan” los modelos LLM?
https://github.com/datos-fundar/sesgos_llm
bard bard-api codigo cohere datos gpt llm sesgo
Last synced: 5 months ago
JSON representation
¿Cómo “se equivocan” los modelos LLM?
- Host: GitHub
- URL: https://github.com/datos-fundar/sesgos_llm
- Owner: datos-Fundar
- License: other
- Created: 2024-01-24T18:04:30.000Z (over 2 years ago)
- Default Branch: main
- Last Pushed: 2024-10-21T13:02:51.000Z (over 1 year ago)
- Last Synced: 2024-12-19T14:03:39.020Z (over 1 year ago)
- Topics: bard, bard-api, codigo, cohere, datos, gpt, llm, sesgo
- Language: Jupyter Notebook
- Homepage: https://fund.ar/publicacion/sesgos-algoritmicos-y-representacion-social-en-los-modelos-de-lenguaje-generativo/
- Size: 9.13 MB
- Stars: 1
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
- Citation: CITATION.cff
Awesome Lists containing this project
README
[](https://fund.ar/publicacion/sesgos-algoritmicos-y-representacion-social-en-los-modelos-de-lenguaje-generativo/)
[](https://zenodo.org/doi/10.5281/zenodo.11186044)
[](https://creativecommons.org/licenses/by/4.0/)
Este repositorio forma parte del documento de trabajo [Sesgos algorítmicos y representación social en los modelos de lenguaje generativo (LLM)](https://fund.ar/publicacion/sesgos-algoritmicos-y-representacion-social-en-los-modelos-de-lenguaje-generativo/) publicado por el [equipo de Datos de Fundar](https://fund.ar/area/datos/). Este artículo se fundamenta en los hallazgos presentes en este [artículo](https://arxiv.org/pdf/2303.17548.pdf) publicado por la Universidad de Stanford que utilizó el conjunto de datos [OpinionQA](https://paperswithcode.com/dataset/opinionqa) y la metodología para evaluar Modelos de Lenguaje (LMs) mediante encuestas de opinión pública.
Aplicamos un enfoque similar para explorar cómo los LMs reflejan y se alinean con las opiniones de diversos grupos demográficos en el contexto argentino. A partir de preguntas adaptadas de encuestas de [Latinobarómetro](https://www.latinobarometro.org/lat.jsp), abordamos temas relevantes para el panorama sociopolítico argentino y analizamos el alineamiento de las respuestas de los LMs con diferentes segmentos de la población. Nuestro objetivo fue revelar posibles sesgos y discrepancias, proporcionando una comprensión matizada de cómo estos modelos interpretan opiniones en el contexto específico de Argentina.
El propósito de este repositorio es permitir a cualquier persona replicar el trabajo realizado.
> [!NOTE]
> Desde el día en que se realizó este trabajo hasta la fecha, las interfaces, las APIs,
> y los modelos pudieron haber cambiado. Por ende, los resultados pueden variar o ser
> filtrados de una manera que no está considerada en este estudio.
## Organización del proyecto:
En [`datasets`](./datasets/) se encuentran los datos de Latinobarómetro utilizados para promptear a los modelos y evaluar las respuestas.
En [`outputs`](./outputs/) se encuentran los resultados de los distintos scripts y notebooks. (A destacar, los gráficos generados y las respuestas consolidadas de cada modelo).
El análisis está repartido entre las Jupyter Notebooks y los [scripts](./scripts/).
En particular:
- `bard.ipynb`, `chatgpt.ipynb`, y `cohere.ipynb` contienen las notebooks donde se promptean a los correspondientes modelos con las preguntas seleccionadas.
- Las notebooks `distances_` contienen el cálculo de las distancias de opinión correspondientes a cada modelo.
- En `scripts/` se realizan los modelos de regresión lineal ajustados a través de OLS para el análisis multivariado. Cada script analiza un subset diferente de datos.
- En `etc/` hay Jupyter Notebooks que contienen un analisis exploratorio de los datasets.
----
**Este documento es parte de la serie [_Inteligencia Artificial_](https://fund.ar/serie/inteligencia-artificial)**