https://github.com/mcp-tool-shop-org/runforge-vscode

RunForge VS Code Extension - Push-button ML training with presets
https://github.com/mcp-tool-shop-org/runforge-vscode

deterministic developer-tools machine-learning mcp python scikit-learn training typescript vscode vscode-extension

Last synced: 2 months ago
JSON representation

RunForge VS Code Extension - Push-button ML training with presets

Host: GitHub
URL: https://github.com/mcp-tool-shop-org/runforge-vscode
Owner: mcp-tool-shop-org
License: mit
Created: 2026-02-01T03:51:55.000Z (5 months ago)
Default Branch: main
Last Pushed: 2026-02-27T06:38:59.000Z (4 months ago)
Last Synced: 2026-02-27T12:59:00.600Z (4 months ago)
Topics: deterministic, developer-tools, machine-learning, mcp, python, scikit-learn, training, typescript, vscode, vscode-extension
Language: Python
Homepage: https://mcp-tool-shop-org.github.io/runforge-vscode/
Size: 3.44 MB
Stars: 0
Watchers: 0
Forks: 0
Open Issues: 0
Metadata Files:
- Readme: README.es.md
- Changelog: CHANGELOG.md
- License: LICENSE

Awesome Lists containing this project

README

Entrenamiento de modelos de aprendizaje automático con un solo clic, que ofrece un comportamiento determinista y basado en contratos.

La fase 3 (capacidades e interpretabilidad) se ha completado con la versión 0.3.6.0.
Los trabajos futuros se llevarán a cabo bajo los contratos de la fase 4.

---

## 🛡️ La garantía de RunForge

RunForge es un software diseñado para eliminar la frase "funciona en mi máquina" y reemplazarla con una certeza basada en análisis forenses.

### Lo que garantizamos
1. **Determinismo:** Cada ejecución se inicia con una semilla específica. Ejecutar la misma configuración con la misma semilla y los mismos datos produce exactamente el mismo modelo.
2. **Trazabilidad:** Cada registro en el archivo `run.json` incluye el identificador SHA del commit de Git, la ruta del intérprete de Python y la versión de la extensión utilizada. Se puede rastrear cualquier modelo hasta el código que lo generó.
3. **Auditoría:** Los artefactos (modelos, métricas, registros) se guardan en el disco en formatos estándar (JSON, joblib). No hay bases de datos ocultas, ni dependencias de la nube.

### Lo que esto no es
- **No es una herramienta mágica de AutoML**: No intentamos adivinar lo que necesita. Ejecutamos configuraciones específicas y personalizables.
- **No es una plataforma en la nube**: No enviamos sus datos a ningún lugar. Todo el proceso se realiza localmente, en su espacio de trabajo de VS Code.

Para obtener información completa sobre el modelo de confianza, consulte el documento [docs/TRUST_MODEL.md](docs/TRUST_MODEL.md).

### Ciclo de vida de una ejecución

```
dataset.csv
│
▼
┌─────────────────────────────────────────────────────────────┐
│ Training (run_training) │
│ │
│ 1. Validate dataset (label column, numeric values) │
│ 2. Compute dataset fingerprint (SHA-256) │
│ 3. Split 80/20 train/val (deterministic, stratified) │
│ 4. Fit pipeline (StandardScaler + Classifier) │
│ 5. Compute metrics │
│ 6. Extract interpretability (if supported) │
└─────────────────────────────────────────────────────────────┘
│
▼
.runforge/runs//
├── run.json ← Metadata + pointers
├── metrics.json ← Phase 2 metrics (3 keys)
├── metrics.v1.json ← Detailed metrics by profile
└── artifacts/
├── model.pkl ← Trained pipeline
├── feature_importance.v1.json ← (RandomForest only)
├── linear_coefficients.v1.json ← (Linear models only)
└── interpretability.index.v1.json ← Unified index
```

---

## Instalación

```bash
npm install
npm run compile
```

## Comandos

| Comando. | Descripción. |
| Please provide the English text you would like me to translate. I am ready to translate it into Spanish. | Por favor, proporciona el texto que deseas que traduzca. |
| `RunForge: Train (Standard)` | Ejecutar el entrenamiento utilizando la configuración predefinida "std-train". |
| `RunForge: Train (High Quality)` | Ejecutar el entrenamiento utilizando la configuración predefinida "hq-train". |
| `RunForge: Open Runs` | Ver las sesiones de entrenamiento completadas. |
| `RunForge: Inspect Dataset` | Validar el conjunto de datos antes del entrenamiento (versión 0.2.2.1 o superior). |
| `RunForge: Open Latest Run Metadata` | Ver los metadatos de la última ejecución (versión 0.2.2.1 o superior). |
| `RunForge: Inspect Model Artifact` | Ver la estructura de la tubería (pipeline) del modelo "model.pkl" (versión 0.2.2.2 o superior). |
| `RunForge: Browse Runs` | Ver todas las ejecuciones con sus acciones (resumen, diagnósticos, artefactos) (versión 0.2.3 o superior). |
| `RunForge: View Latest Metrics` | Consulte las métricas detalladas en el archivo metrics.v1.json (versión 0.3.3 o superior). |
| `RunForge: View Latest Feature Importance` | Visualice la importancia de las características para los modelos de Random Forest (versión 0.3.4 y posteriores). |
| `RunForge: View Latest Linear Coefficients` | Ver los coeficientes de los modelos lineales (versión 0.3.5 o superior). |
| `RunForge: View Latest Interpretability Index` | Ver el índice unificado de todos los elementos relacionados con la interpretabilidad (versión 0.3.6 o superior). |
| `RunForge: Export Latest Run as Markdown` | Guardar un resumen formateado en Markdown de la última ejecución (versión 0.4.3 o superior). |

## Uso

1. Establezca la variable de entorno `RUNFORGE_DATASET` con la ruta a su archivo CSV.
2. El archivo CSV debe tener una columna llamada `label`.
3. Inicie el entrenamiento a través del panel de comandos.

---

## Garantías (versión 0.2.1 o superior)

RunForge para VS Code ofrece un entrenamiento de modelos de aprendizaje automático determinista y basado en contratos. Las garantías que se indican a continuación son intencionales y se verifican mediante pruebas.

### Determinismo

Dado el mismo conjunto de datos, configuración y versión de RunForge:

- Las divisiones de entrenamiento y validación son idénticas en todas las ejecuciones.
- Los resultados generados son reproducibles.
- Los resultados de las métricas son estables.

No existe aleatoriedad fuera de los comportamientos que se definen explícitamente.

### Manejo de etiquetas

- La columna que contiene las etiquetas se especifica explícitamente.
- La etiqueta nunca se deduce de la posición de la columna.
- Las etiquetas mal configuradas o ausentes generan errores de forma temprana.

### Contrato de medición

El entrenamiento produce exactamente tres métricas:

```json
{
"accuracy": number,
"num_samples": number,
"num_features": number
}
```

No se añaden campos adicionales de forma implícita.
La ampliación del esquema requiere un cambio en el contrato que se gestione mediante versiones.

### Artefactos del modelo

- `model.pkl` siempre es una instancia serializada de `sklearn.Pipeline`.
- Todo el preprocesamiento (por ejemplo, la normalización) está integrado.
- El archivo es autónomo y está listo para su uso en inferencia.

No se requieren pasos de preprocesamiento externos.

### Datos faltantes

- Las filas que contienen valores faltantes se eliminan de forma determinista.
- Se registra el número de filas eliminadas.
- No se realiza ninguna imputación implícita.

### Fuente de información confiable

- Toda la lógica de ejecución de Python se encuentra en el directorio `python/ml_runner/`.
- No existen implementaciones duplicadas ni alternativas.
- Las pruebas garantizan la coherencia entre el comportamiento de TypeScript y el de Python.

### Política de estabilidad

- El comportamiento en la versión v0.2.1 está fijado y no se modificarán sus características.
- Los cambios que rompen la compatibilidad requieren un aumento explícito de la versión principal.
- Los cambios en el comportamiento que no se anuncian se consideran errores.

---

## Goles anulados (intencionales)

Actualmente, RunForge no intenta:

- Selección automática de modelos (el usuario debe elegir explícitamente).
- Ajuste de hiperparámetros (los valores predeterminados son fijos para cada configuración).
- Realización de entrenamiento en línea o incremental.
- Ocultamiento del comportamiento del entrenamiento mediante heurísticas.

La precisión y la transparencia son prioritarias, incluso por encima de la automatización.

---

## Observabilidad (versión 0.2.2.1 o superior)

La fase 2.2.1 proporciona información detallada sobre las ejecuciones de entrenamiento sin modificar el comportamiento del proceso de entrenamiento.

### Ejecutar metadatos

Cada ejecución de entrenamiento genera un archivo `run.json` que contiene:

- Identificador de la ejecución y marca de tiempo.
- Huella digital del conjunto de datos (SHA-256).
- Columna de etiquetas y número de características.
- Número de filas eliminadas.
- Captura de métricas.
- Rutas de los archivos generados.

### Inspección del conjunto de datos

Inspeccione los conjuntos de datos antes de comenzar el entrenamiento:

```bash
python -m ml_runner inspect --dataset data.csv --label label
```

Devuelve los nombres de las columnas, el número de filas, el número de características y la validación de las etiquetas.

### Seguimiento del origen.
Rastreabilidad del origen.
Control de la procedencia

Todas las ejecuciones están indexadas en el archivo `.runforge/index.json` para facilitar el seguimiento:

- A partir de un archivo `model.pkl`, rastrear hasta los metadatos de la ejecución.
- Encontrar todas las ejecuciones correspondientes a una huella digital específica de un conjunto de datos.
- Índice de solo escritura (nunca se reordena ni se eliminan elementos).

---

## Introspección de artefactos (versión 0.2.2.2 o superior)

La fase 2.2.2 introduce la posibilidad de inspeccionar los elementos generados durante el entrenamiento, pero solo en modo de lectura.

La función de inspección es de solo lectura y no permite volver a entrenar ni modificar los elementos.

### Inspección de tuberías

Inspeccione el contenido de un archivo `model.pkl` sin necesidad de volver a entrenar el modelo:

```bash
python -m ml_runner inspect-artifact --artifact model.pkl
```

Devuelve una estructura JSON que contiene:

- Pasos del proceso (en orden).
- Tipos de pasos y módulos.
- Detección de preprocesamiento.

Okay, I understand. Please provide the English text you would like me to translate.

```json
{
"schema_version": "0.2.2.2",
"artifact_path": "model.pkl",
"pipeline_steps": [
{"name": "scaler", "type": "StandardScaler", "module": "sklearn.preprocessing._data"},
{"name": "clf", "type": "LogisticRegression", "module": "sklearn.linear_model._logistic"}
],
"has_preprocessing": true,
"step_count": 2
}
```

### Diagnósticos

Los diagnósticos estructurados explican por qué una ejecución se comportó de la manera en que lo hizo:

Todos los diagnósticos están en formato JSON, que es legible por máquina (no es necesario realizar ningún análisis de registros).

---

## Explorar rutas (versión 0.2.3 o superior)

La fase 2.3 introduce un navegador de ejecuciones unificado con funciones de acceso rápido.

### Utilizando las funciones de exploración

1. Abra el panel de comandos (`Ctrl+Shift+P`).
2. Ejecute `RunForge: Explorar ejecuciones`.
3. Seleccione una ejecución de la lista (mostrando primero las más recientes).
4. Elija una acción:
- **Abrir resumen de la ejecución** — Ver los metadatos de la ejecución en formato Markdown legible.
- **Ver diagnósticos** — Consultar los eventos que ocurrieron durante la ejecución.
- **Inspeccionar el artefacto del modelo** — Ver la estructura del flujo de trabajo.
- **Copiar la huella digital del conjunto de datos** — Copiar el valor SHA-256 al portapapeles.

### Diagnósticos integrados

Los diagnósticos se obtienen a partir de los campos del archivo "run.json":

"Please provide the text you would like me to translate." |
| `dropped_rows_missing_values > 0` | `MISSING_VALUES_DROPPED` |

Se prevé que en futuras fases se implementen diagnósticos de emisiones más completos y estructurados.

---

## Selección de modelo (versión 0.3.1 o superior)

La fase 3.1 introduce la selección explícita del modelo, al tiempo que mantiene todas las garantías de la fase 2.

### Modelos compatibles

### Configuración

Configure la familia de modelos en la configuración de VS Code:

```json
{
"runforge.modelFamily": "random_forest"
}
```

O bien, utilice la interfaz de configuración: busque "Familia de modelos RunForge" y selecciónela en el menú desplegable.

### Uso de la línea de comandos

```bash
python -m ml_runner train --preset std-train --out ./run --device cpu --model random_forest
```

El argumento `--model` es opcional. El valor predeterminado es: `logistic_regression`.

### Origen.
Procedencia.
Antecedentes.
Historia.
Procedimiento.
Fuente.
Orígenes.
Procedencia (de una obra de arte, por ejemplo)

El modelo específico utilizado se registra en el archivo `run.json`:

```json
{
"model_family": "random_forest",
"runforge_version": "0.3.1.0"
}
```

### Compatibilidad con versiones anteriores

- Todas las ejecuciones de la Fase 2 siguen siendo legibles.
- El comportamiento predeterminado no ha cambiado (regresión logística).
- No se requiere ninguna migración.
- El preprocesamiento se mantiene sin cambios (StandardScaler para todos los modelos).

---

## Hiperparámetros y perfiles de entrenamiento (versión 0.3.2 y posteriores)

La fase 3.2 introduce un control explícito de los hiperparámetros y perfiles de entrenamiento.

### Perfiles de formación

Los perfiles predefinidos ofrecen hiperparámetros configurados previamente.

| Perfil. | Descripción. | Modelo de familia. |
| Please provide the English text you would like me to translate. I am ready to translate it into Spanish. | "The company is committed to providing high-quality products and services."

"We are looking for a motivated and experienced candidate."

"The meeting will be held on Tuesday at 10:00 AM."

"Please submit your application by the end of the week."

"We offer a competitive salary and benefits package."
-------------

"La empresa está comprometida a ofrecer productos y servicios de alta calidad."

"Estamos buscando un candidato motivado y con experiencia."

"La reunión se llevará a cabo el martes a las 10:00 AM."

"Por favor, envíe su solicitud antes de que finalice la semana."

Configure en la configuración de VS Code:
```json
{
"runforge.profile": "fast"
}
```

### Hiperparámetros de la interfaz de línea de comandos

Sobreescribir los hiperparámetros individuales a través de la línea de comandos:

```bash
python -m ml_runner train --preset std-train --out ./run --device cpu --param C=0.5 --param max_iter=200
```

### Reglas de precedencia

Cuando tanto los parámetros del perfil como los parámetros de la línea de comandos están configurados:

1. **Parámetros especificados en la línea de comandos (`--param`)** (mayor prioridad)
2. **Parámetros expandidos a partir del perfil**
3. **Valores predeterminados del modelo** (menor prioridad)

### Origen.
Procedencia.
Antecedentes.
Historia.
Procedimiento.
(Dependiendo del contexto, también podría traducirse como: Linaje, Herencia, Origen geográfico, etc.)

Los hiperparámetros y los perfiles se registran en el archivo `run.json`:

```json
{
"model_family": "random_forest",
"profile_name": "thorough",
"profile_version": "1.0",
"expanded_parameters_hash": "abc123...",
"hyperparameters": [
{"name": "n_estimators", "value": 200, "source": "profile"},
{"name": "max_depth", "value": 5, "source": "cli"}
]
}
```

Cuando no se utiliza un perfil, los campos del perfil se omiten por completo (no se establecen como valores nulos).

---

## Métricas específicas para cada modelo (versión 0.3.3 y posteriores)

La fase 3.3 introduce métricas detalladas y específicas para cada modelo, con la posibilidad de seleccionar perfiles basados en las capacidades.

### Perfiles de métricas

Los perfiles de métricas se seleccionan automáticamente en función de las capacidades del modelo:

| Perfil. | Descripción. | Métricas. |
| Please provide the English text you would like me to translate. I am ready to translate it into Spanish. | Please provide the English text you would like me to translate. I am ready to translate it into Spanish. | Please provide the English text you would like me to translate. I am ready to translate it into Spanish. |
| `classification.base.v1` | Todos los clasificadores. | precisión, exactitud, exhaustividad, F1, matriz de confusión. |
| `classification.proba.v1` | Binario + probabilidad de predicción. | base + ROC-AUC, pérdida de logaritmo. |
| `classification.multiclass.v1` | 3 clases o más. | base + precisión/exhaustividad/f1 por clase. |

### Lógica de selección de perfiles

- Clasificación binaria + `predict_proba` → `classification.proba.v1`
- Clasificación multiclase (3 o más clases) → `classification.multiclass.v1`
- En cualquier otro caso → `classification.base.v1`

### Capacidades del modelo

**English:**

You are a professional English (en) to Spanish (es) translator. Your goal is to accurately convey the meaning and nuances of the original English text while adhering to Spanish grammar, vocabulary, and cultural sensitivities.
Produce only the Spanish translation, without any additional explanations or commentary. Please translate the following English text into Spanish:

-------------------

**over**

**Spanish:**

Usted es un traductor profesional de inglés (en) a español (es). Su objetivo es transmitir con precisión el significado y los matices del texto original en inglés, respetando la gramática, el vocabulario y las sensibilidades culturales del español.
Por favor, produzca únicamente la traducción al español, sin explicaciones ni comentarios adicionales. Traduzca el siguiente texto en inglés al español:

------------------- |
| RegresiónLogística | ✅ | ✅ |
| Bosque Aleatorio. | ✅ | ❌ |
| LinearSVC | ❌ | ✅ (Solo para la métrica ROC-AUC) |

### Artefacto de métricas

Actualmente, el proceso de entrenamiento genera tanto el archivo `metrics.v1.json` como el archivo `metrics.json`.

```json
{
"schema_version": "metrics.v1",
"metrics_profile": "classification.proba.v1",
"num_classes": 2,
"accuracy": 0.95,
"precision_macro": 0.94,
"recall_macro": 0.93,
"f1_macro": 0.94,
"confusion_matrix": [[45, 5], [3, 47]],
"roc_auc": 0.97,
"log_loss": 0.15
}
```

### Ejecutar metadatos

El archivo `run.json` ahora incluye un puntero a `metrics_v1`:

```json
{
"schema_version": "run.v0.3.3",
"metrics_v1": {
"schema_version": "metrics.v1",
"metrics_profile": "classification.proba.v1",
"artifact_path": "metrics.v1.json"
},
"artifacts": {
"model_pkl": "artifacts/model.pkl",
"metrics_v1_json": "metrics.v1.json"
}
}
```

### Compatibilidad con versiones anteriores

- El archivo `metrics.json` (Fase 2) permanece sin cambios.
- Todas las herramientas existentes siguen funcionando.
- Los campos del perfil en `run.json` se muestran juntos o no se muestran en absoluto.

---

## Importancia de las características (versión 0.3.4 y posteriores)

La fase 3.4 introduce una función de extracción de la importancia de las características que solo permite la lectura, y que está disponible para los modelos compatibles.

### Modelos compatibles

La importancia de las características solo está disponible para los modelos que tienen señales de importancia integradas.

| Model | Soportado. | Tipo de importancia. |
| Please provide the English text you would like me to translate. I am ready to translate it into Spanish. | "Please provide the text you would like me to translate." | "The company is committed to providing high-quality products and services."

"We are looking for a motivated and experienced candidate."

"The meeting will be held on Tuesday at 10:00 AM."

"Please submit your application by the end of the week."

"We offer a competitive salary and benefits package."
-----------------
"La empresa está comprometida a ofrecer productos y servicios de alta calidad."

"Estamos buscando un candidato motivado y con experiencia."

"La reunión se llevará a cabo el martes a las 10:00 AM."

"Por favor, envíe su solicitud antes de que finalice la semana."

**Sin aproximaciones:** Si el modelo no admite la importancia nativa, no se genera ningún resultado.

### Importancia de las características

Las ejecuciones de RandomForest generan el archivo `artifacts/feature_importance.v1.json`:

```json
{
"schema_version": "feature_importance.v1",
"model_family": "random_forest",
"importance_type": "gini_importance",
"num_features": 10,
"features_by_importance": [
{"name": "feature_a", "importance": 0.35, "rank": 1},
{"name": "feature_b", "importance": 0.25, "rank": 2}
],
"features_by_original_order": [
{"name": "feature_a", "importance": 0.35, "index": 0},
{"name": "feature_b", "importance": 0.25, "index": 1}
],
"top_k": ["feature_a", "feature_b"]
}
```

### Ejecutar metadatos

El archivo `run.json` incluye información sobre la importancia de las características, cuando está disponible.

```json
{
"feature_importance_schema_version": "feature_importance.v1",
"feature_importance_artifact": "artifacts/feature_importance.v1.json",
"artifacts": {
"model_pkl": "artifacts/model.pkl",
"feature_importance_json": "artifacts/feature_importance.v1.json"
}
}
```

Cuando la importancia de las características no está disponible, estos campos se omiten por completo (no se incluyen valores nulos).

### Diagnósticos

Los modelos no soportados emiten diagnósticos estructurados:

| Code | Descripción. |
| Translate the following English text into Spanish:

"The company is committed to providing high-quality products and services. We strive to meet and exceed customer expectations. Our team is dedicated to innovation and continuous improvement. We value integrity, transparency, and respect in all our interactions."
"La empresa está comprometida a ofrecer productos y servicios de alta calidad. Nos esforzamos por satisfacer y superar las expectativas de nuestros clientes. Nuestro equipo está dedicado a la innovación y la mejora continua. Valoramos la integridad, la transparencia y el respeto en todas nuestras interacciones." | Por favor, proporciona el texto que deseas que traduzca. |
| `FEATURE_IMPORTANCE_UNSUPPORTED_MODEL` | El modelo no admite la función nativa de cálculo de la importancia de las variables. |
| `FEATURE_NAMES_UNAVAILABLE` | No se pudieron resolver los nombres de las características. |

### No compatible en la versión 1

A continuación, se enumeran explícitamente los elementos que no están incluidos en el alcance de la versión 1:

- Importancia basada en coeficientes para modelos lineales.
- Explicaciones mediante SHAP/LIME.
- Importancia por permutación.
- Gráficos de dependencia parcial.

### Hiperparámetros soportados

**Regresión Logística:**
- `C` (flotante, > 0): Intensidad de la regularización.
- `max_iter` (entero, > 0): Número máximo de iteraciones.
- `solver` (cadena de texto): Algoritmo de optimización.
- `warm_start` (booleano): Reutilizar la solución anterior.

**Bosque Aleatorio:**
- `n_estimators` (entero, > 0): Número de árboles.
- `max_depth` (entero o None): Profundidad máxima de los árboles.
- `min_samples_split` (entero, >= 2): Número mínimo de muestras para dividir un nodo.
- `min_samples_leaf` (entero, > 0): Número mínimo de muestras por hoja.

**SVC Lineal:**
- `C` (flotante, > 0): Intensidad de la regularización.
- `max_iter` (entero, > 0): Número máximo de iteraciones.

---

## Coeficientes lineales (versión 0.3.5 y posteriores)

La fase 3.5 introduce la extracción de coeficientes de solo lectura para clasificadores lineales.

### Modelos compatibles

Los coeficientes lineales están disponibles para los modelos que tienen un atributo nativo llamado `coef_`:

| Model | Soportado.
Apoyado.
Respaldado.
Asistido.
Validado.
Habilitado.
Permitido.
Autorizado.
Contenido.
Sostenido. | Tipo de coeficiente. |
| Please provide the English text you would like me to translate. I am ready to translate it into Spanish. | Por favor, proporciona el texto que deseas que traduzca. | Sure, here is the Spanish translation of the English text:

**Sin aproximaciones:** Si el modelo no admite coeficientes nativos, no se genera ningún artefacto.

### Espacio de coeficientes (IMPORTANTE)

Todos los coeficientes están expresados en un espacio de características normalizado.

Esto significa:
- Los coeficientes corresponden a las características DESPUÉS de la aplicación de StandardScaler.
- Los valores representan la influencia por cada aumento de una desviación estándar.
- No se intenta "invertir" la escala para volver a las unidades originales de las características.
- La comparación de coeficientes entre diferentes características es significativa (mismo rango).
- La comparación de coeficientes con los valores originales de las características NO es significativa.

### Artefacto debido a los coeficientes lineales

Las ejecuciones del modelo lineal generan el archivo `artifacts/linear_coefficients.v1.json`:

```json
{
"schema_version": "linear_coefficients.v1",
"model_family": "logistic_regression",
"coefficient_space": "standardized",
"num_features": 10,
"num_classes": 2,
"classes": [0, 1],
"intercepts": [
{"class": 1, "intercept": 0.5}
],
"coefficients_by_class": [
{
"class": 1,
"features": [
{"name": "feature_a", "coefficient": 2.35, "abs_coefficient": 2.35, "rank": 1},
{"name": "feature_b", "coefficient": -1.25, "abs_coefficient": 1.25, "rank": 2}
]
}
],
"top_k_by_class": [
{"class": 1, "top_features": ["feature_a", "feature_b"]}
]
}
```

### Soporte para múltiples clases

Para la clasificación multiclase (con 3 o más clases), los coeficientes se agrupan por clase:

- Cada clase tiene su propio conjunto de coeficientes.
- Las etiquetas de las clases se ordenan de forma determinista.
- No se realiza ninguna agregación entre clases en la versión 1.

### Ejecutar metadatos

El archivo `run.json` incluye los coeficientes lineales de referencia, cuando están disponibles.

```json
{
"linear_coefficients_schema_version": "linear_coefficients.v1",
"linear_coefficients_artifact": "artifacts/linear_coefficients.v1.json",
"artifacts": {
"model_pkl": "artifacts/model.pkl",
"linear_coefficients_json": "artifacts/linear_coefficients.v1.json"
}
}
```

Cuando los coeficientes no están disponibles, estos campos se omiten por completo (no se dejan en blanco).

### Diagnósticos

Los modelos no soportados emiten diagnósticos estructurados:

| Code | Descripción. |
| Por favor, proporciona el texto que deseas que traduzca. | Please provide the English text you would like me to translate. I am ready to translate it into Spanish. |
| `LINEAR_COEFFICIENTS_UNSUPPORTED_MODEL` | El modelo no admite la extracción de coeficientes. |
| `COEFFICIENTS_MISSING_ON_ARTIFACT` | El clasificador no tiene el atributo "coef_". |
| `FEATURE_NAMES_UNAVAILABLE` | No se pudieron resolver los nombres de las características. |

### Importancia de las características frente a los coeficientes lineales

**English:**

------------------

**Spanish:**

Eres un traductor profesional de inglés (en) a español (es). Tu objetivo es transmitir con precisión el significado y los matices del texto original en inglés, respetando la gramática, el vocabulario y las sensibilidades culturales del español.
Por favor, proporciona únicamente la traducción al español, sin explicaciones ni comentarios adicionales. Traduce el siguiente texto en inglés al español:

------------------ | "The company is committed to providing high-quality products and services."

"We are looking for a motivated and experienced candidate."

"The meeting will be held on Tuesday at 10:00 AM."

"Please submit your application by the end of the week."

"We offer a competitive salary and benefits package."
---------------

"La empresa está comprometida a ofrecer productos y servicios de alta calidad."

"Estamos buscando un candidato motivado y con experiencia."

"La reunión se llevará a cabo el martes a las 10:00 AM."

"Por favor, envíe su solicitud antes de que finalice la semana."

Estos son métodos complementarios:
- Utilice la importancia de las características para modelos de conjunto.
- Utilice los coeficientes lineales para modelos lineales interpretables.

### Guía de interpretación

Para la regresión logística (binaria):
- Coeficiente positivo: Un aumento en la característica implica una mayor probabilidad de pertenecer a la clase positiva.
- Coeficiente negativo: Un aumento en la característica implica una menor probabilidad de pertenecer a la clase positiva.
- Magnitud: Un valor absoluto mayor indica una mayor influencia.

Ejemplo: `coeficiente = 2.0` significa +1 desviación estándar en esta característica → +2.0 en la escala log-odds.

---

## Índice de interpretabilidad (versión 0.3.6 y posteriores)

La fase 3.6 introduce un índice unificado que relaciona todos los resultados de interpretabilidad para una ejecución específica.

### Propósito

El índice de interpretabilidad responde a las siguientes preguntas: "¿Qué resultados de interpretabilidad se han generado en esta ejecución, qué versiones tienen y dónde se encuentran?"

No se realiza ningún cálculo nuevo; simplemente se vinculan y se resumen elementos ya existentes.

### Índice de artefactos

Cada ejecución genera el archivo `artifacts/interpretability.index.v1.json`:

```json
{
"schema_version": "interpretability.index.v1",
"run_id": "20240101-120000-abc12345",
"runforge_version": "0.3.6.0",
"created_at": "2024-01-01T12:00:00+00:00",
"available_artifacts": {
"metrics_v1": {
"schema_version": "metrics.v1",
"path": "metrics.v1.json",
"summary": {
"metrics_profile": "classification.proba.v1",
"accuracy": 0.95
}
},
"feature_importance_v1": {
"schema_version": "feature_importance.v1",
"path": "artifacts/feature_importance.v1.json",
"summary": {
"model_family": "random_forest",
"top_k": ["feature_a", "feature_b", "feature_c"]
}
},
"linear_coefficients_v1": {
"schema_version": "linear_coefficients.v1",
"path": "artifacts/linear_coefficients.v1.json",
"summary": {
"model_family": "logistic_regression",
"num_classes": 2,
"top_k_by_class": [{"class": 1, "top_features": ["feat_a", "feat_b"]}]
}
}
}
}
```

### Reglas de disponibilidad

- Los artefactos que no están disponibles se **omiten** de la lista `available_artifacts` (no se establecen como nulos o falsos).
- El índice solo indica la disponibilidad si el archivo realmente existe.
- Una ejecución básica (LogisticRegression) tendrá `metrics_v1` y `linear_coefficients_v1`.
- Una ejecución de RandomForest tendrá `metrics_v1` y `feature_importance_v1`.

### Resumen del contenido

Los resúmenes incluyen únicamente datos de referencia (sin valores numéricos repetidos).

| Objeto antiguo. | Resumen. Contiene. |
| Please provide the English text you would like me to translate. I am ready to translate it into Spanish. | "The company is committed to providing high-quality products and services."

"We are looking for a motivated and experienced candidate."

"The meeting will be held on Tuesday at 10:00 AM."

"Please submit your application by the end of the week."

"We offer a competitive salary and benefits package."
------------------
"La empresa está comprometida a ofrecer productos y servicios de alta calidad."

"Estamos buscando un candidato motivado y con experiencia."

"La reunión se llevará a cabo el martes a las 10:00 AM."

"Por favor, envíe su solicitud antes de que finalice la semana."

"Ofrecemos un salario competitivo y un paquete de beneficios." |
| métricas_v1 | `metrics_profile`, `accuracy` (obtenidos del archivo run.json) |
| importancia_de_las_características_v1 | `model_family`, `top_k` (solo los nombres, máximo 5). |
| coeficientes_lineales_v1 | `model_family`, `num_classes`, `top_k_by_class` (solo los nombres) |

### Comando de VS Code

Utilice la opción "RunForge: Ver el índice de interpretabilidad más reciente" para ver un resumen formateado con enlaces directos para abrir cada elemento individualmente.

---

## Comenzando

Para una guía paso a paso, consulte [docs/WALKTHROUGH.md](docs/WALKTHROUGH.md).

---

## Contratos y documentación

### Documentos esenciales

| Documento. | Propósito. |
| Please provide the English text you would like me to translate. I am ready to translate it into Spanish. | Please provide the English text you would like me to translate. I am ready to translate it into Spanish. |
| [docs/TRUST_MODEL.md](docs/TRUST_MODEL.md) | Cómo RunForge genera confianza. |
| [docs/WALKTHROUGH.md](docs/WALKTHROUGH.md) | Visita guiada de 2 a 3 minutos. |
| [CONTRACT.md](CONTRACT.md) | Contrato de conducta completo. |
| [CONTRACT-PHASE-3.md](CONTRACT-PHASE-3.md) | Reglas de expansión para la fase 3. |

### Fase 2 (Congelada)

### Fase 3 (congelada a partir de la versión 0.3.6.0)

| Documento. | Scope |
| Please provide the English text you would like me to translate. I am ready to translate it into Spanish. | Please provide the English text you would like me to translate. I am ready to translate it into Spanish. |
| [docs/PHASE-3.1-ACCEPTANCE.md](docs/PHASE-3.1-ACCEPTANCE.md) | Selección de modelos. |
| [docs/PHASE-3.2-ACCEPTANCE.md](docs/PHASE-3.2-ACCEPTANCE.md) | Hiperparámetros y perfiles. |
| [docs/PHASE-3.3-ACCEPTANCE.md](docs/PHASE-3.3-ACCEPTANCE.md) | Métricas específicas para cada modelo. |
| [docs/PHASE-3.4-ACCEPTANCE.md](docs/PHASE-3.4-ACCEPTANCE.md) | Importancia de las características. |
| [docs/PHASE-3.5-ACCEPTANCE.md](docs/PHASE-3.5-ACCEPTANCE.md) | Coeficientes lineales. |
| [docs/PHASE-3.6-ACCEPTANCE.md](docs/PHASE-3.6-ACCEPTANCE.md) | Índice de interpretabilidad. |

### Futuro

Consulte el documento [docs/DEFERRED_UX_ENHANCEMENTS.md](docs/DEFERRED_UX_ENHANCEMENTS.md) para conocer las mejoras planificadas.

---

## Estado de la fase

Todas las garantías correspondientes a las fases 2 y 3 están fijadas. Los trabajos futuros requerirán contratos de la fase 4.

---

## Licencia

MIT.

ecosyste.ms

Data

Tools

Indexes

Applications

Experiments

Awesome

https://github.com/mcp-tool-shop-org/runforge-vscode

Awesome Lists containing this project

README