| Nombre | Partido | Región | % Asist. | Interv. | |
|---|---|---|---|---|---|
| Seleccione un período. | |||||
| Nº | Fecha | Tipo | Tema principal | Presidente | Asist. | |
|---|---|---|---|---|---|---|
| Seleccione un período. | ||||||
Dashboard de acceso público a los datos históricos de la Cámara de Diputadas y Diputados de Chile. Centraliza asistencia individual, intervenciones en sala, votaciones detalladas, tramitación legislativa y análisis de sentimiento desde 1990 hasta hoy. Todo el flujo —desde la descarga hasta la visualización— es automatizado y reproducible.
.asmx). Entrega legislaturas, períodos, diputados, sesiones y sus metadatos, votaciones en sala, comisiones y el boletín XML completo de cada sesión plenaria. El boletín es un XML semi-estructurado que contiene la asistencia nominal, el orden del día, intervenciones y votaciones. No requiere autenticación.__doPostBack y resolviendo formularios/ViewState en cada request.xml.etree.ElementTree.
scrape_camara.py — consulta la API SOAP/XML de la Cámara descargando en modo incremental: nuevas sesiones del período activo, diputados del período actual, votaciones y el XML completo del boletín de cada sesión nueva. Organizado en 9 capas (A–I) por dependencia: catálogos → listados → detalles → votaciones → comisiones.scrape_camara_web.py — recorre camara.cl para complementar el directorio de diputados, actividad legislativa individual, sesiones y votaciones de sala con detalle nominal cuando la web lo publica, además de otras tablas raw usadas como backfill.scrape_proyectos.py — parsea las páginas HTML de camara.cl (proyectos de acuerdo, resolución y ley), simulando la paginación ASP.NET con __doPostBack. Se detiene automáticamente cuando todos los proyectos de una página ya existen en BD.scrape_senado.py — consume la API XML del Senado obteniendo senadores vigentes y proyectos con una ventana configurable de días (variable SENADO_FETCH_DAYS).
camara.cl. Todo eso se consolida en camara_diputados, que actúa como fuente de verdad de esta aplicación. Dentro de esa base, los datos crudos se guardan según origen:catalogos y listados almacenan las respuestas JSON/XML como jsonb. La columna sesiones_detalle.boletin_xml guarda el XML íntegro de cada sesión (texto, sin parsear) para permitir re-procesamiento. Los períodos 1 y 2, que no tienen boletín XML publicado, cuentan con una columna adicional boletin_pdf_texto con el texto extraído por OCR.raw_proyectos almacena proyectos de acuerdo, resolución y ley extraídos del sitio web como jsonb, indexados por id_proyecto y tipo.raw_senado_senadores y raw_senado_proyectos guardan las respuestas XML del Senado también como jsonb.
normalize_congreso_data.py aplica una estrategia distinta según el formato del boletín disponible para cada período:id_diputado correcto.DIPUTADOValue con el ID numérico directamente, permitiendo un join exacto y determinista sin fuzzy matching.<br> y markup mixto) y se parsea con regex en dotall mode, no con un parser XML estándar.
DIPUTADOValue) pasa por este modelo y los resultados se agregan por diputado y por sesión. Es determinista y reproducible.compute_analytics.py genera tablas de métricas ya calculadas que el dashboard consume directamente:analytics_diputado_periodo — asistencia %, intervenciones y rankings por diputado y período.analytics_partido_periodo — comparativas por bloque con normalización de coaliciones: en el Período 10 (2022–2026), los partidos RD, Convergencia Social y Comunes se agrupan como Frente Amplio (FA), reflejando la fusión formal de 2023. En períodos anteriores (P9) se mantiene RD como partido independiente.analytics_sesion — resumen por sesión incluyendo partido_dominante: el partido con más intervenciones en esa sesión, también con normalización de coalición FA aplicada.id_sesion único necesario para los pasos siguientes.id_sesion, solicita el boletín en formato XML. Este documento contiene: la asistencia nominal de todos los diputados (con código de asistencia: Presente, Justificado, Ausente, etc.), el orden del día con los temas y proyectos tratados, y el texto de las intervenciones en sala. No todas las sesiones tienen boletín publicado — ver la pestaña Cobertura.&, ), tags <br> sin cerrar y markup mixto. No lo proceses con un parser XML convencional — usa regex en modo dotall. La estructura varía por período: <SESION> contiene <ASISTENCIA> (diputados con atributos de nombre, partido, código de asistencia) e <INTERVENCIONES> (discursos anotados con DIPUTADOValue en P9+). El atributo VALID="False" en el nodo raíz indica sesión fracasada por falta de quórum.thefuzz + normalización NFKD Unicode.DIPUTADOValue contiene el ID numérico directamente, permitiendo un join exacto sin heurísticas.Disponibilidad de boletines XML (actas oficiales) por período legislativo. Sin boletín no hay datos de asistencia, temas ni intervenciones.
Diagnóstico de cobertura real de votaciones. Esta pestaña distingue entre límites del frontend y límites estructurales de las fuentes históricas.
camara.cl, desde donde se scrapean listados y detalles nominales cuando están publicados. El pipeline normaliza ambas en norm_votaciones y norm_votacion_votos.Boletín N° 4970-04 o Proyecto de Acuerdo N°. Tras aplicar todos los fallbacks, siguen sin tema legible P4 2421/2508, P5 2756/3001, P6 4264/4475, P8 2649/4466, P9 3113/5331 y P10 2936/6480.Cada sesión en la tabla puede mostrar uno de estos iconos indicando una situación especial. Haz clic sobre el icono directamente en la tabla para ver el detalle completo de esa sesión.
VALID="False". Los asistentes mostrados son los que se presentaron, pero insuficientes para constituir quórum.<OBJETO_SESION>, sección "V. TABLA" del boletín, ni el texto PDF de la sesión). Ocurre en sesiones secretas, sesiones de instalación de período y algunas actas históricas muy breves de P1/P2.Restricciones de origen en los datos fuente que afectan la completitud o comparabilidad de ciertas métricas.
camara.cl. En los períodos anteriores la Cámara no publica esa estructura de forma consistente, por lo que no existe una base confiable para reconstruir tarjetas comparables período a período.Decisiones de implementación y procesamiento que pueden afectar la interpretación de los datos.
camara.cl. Ambas se consolidan en la base camara_diputados, que es la única fuente consultada por esta interfaz para sesiones, proyectos, votaciones y analytics.xml.etree.ElementTree.DC → PDC, EVOPOLI → EVOP, PRD → RD, PCS → CS. Errores de parseo (ej. "Abel PRSD") corregidos manualmente.