<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Tech_projects | Lee-Ann Vidal Covas, PhD</title><link>https://leeannvc.com/es/tech_projects/</link><atom:link href="https://leeannvc.com/es/tech_projects/index.xml" rel="self" type="application/rss+xml"/><description>Tech_projects</description><generator>HugoBlox Kit (https://hugoblox.com)</generator><language>es</language><image><url>https://leeannvc.com/media/logo_hu_408c0977b7e48a52.png</url><title>Tech_projects</title><link>https://leeannvc.com/es/tech_projects/</link></image><item><title>Cogito: Speech Data Annotation for Machine Learning</title><link>https://leeannvc.com/es/tech_projects/cogito/</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://leeannvc.com/es/tech_projects/cogito/</guid><description>&lt;h2 id="descripción-general"&gt;Descripción General&lt;/h2&gt;
&lt;p&gt;Trabajé en la anotación y el aseguramiento de la calidad de conjuntos de datos de habla y lenguaje utilizados en modelos de aprendizaje automático, con el objetivo de mejorar el rendimiento del modelo y la consistencia de las anotaciones.&lt;/p&gt;
&lt;h2 id="mi-rol"&gt;Mi Rol&lt;/h2&gt;
&lt;ul&gt;
&lt;li&gt;Anoté datos de habla para emoción, participación y patrones del habla&lt;/li&gt;
&lt;li&gt;Diseñé y refiné enfoques de anotación en distintos proyectos&lt;/li&gt;
&lt;li&gt;Realicé ingeniería de prompts para mejorar los resultados del modelo&lt;/li&gt;
&lt;li&gt;Probé modelos de lenguaje preentrenados y sugerí mejoras de calibración&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id="datos-y-flujos-de-trabajo"&gt;Datos y Flujos de Trabajo&lt;/h2&gt;
&lt;ul&gt;
&lt;li&gt;Procesé datos de audio y texto para pipelines de entrenamiento de ML&lt;/li&gt;
&lt;li&gt;Construí y validé conjuntos de datos anotados para clientes internos y externos&lt;/li&gt;
&lt;li&gt;Gestioné solicitudes de anotación dinámicas en varios equipos&lt;/li&gt;
&lt;li&gt;Contribuí a mejoras en los flujos de trabajo y los procesos de QA&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id="impacto"&gt;Impacto&lt;/h2&gt;
&lt;ul&gt;
&lt;li&gt;Mejoré la consistencia de las anotaciones en los conjuntos de datos&lt;/li&gt;
&lt;li&gt;Contribuí a datos de entrenamiento de mayor calidad para modelos de ML&lt;/li&gt;
&lt;li&gt;Aporté perspectivas que informaron el comportamiento del modelo y las decisiones de UX&lt;/li&gt;
&lt;/ul&gt;</description></item><item><title>Spanish in Boston: Sociolinguistic Dataset &amp; Analysis</title><link>https://leeannvc.com/es/tech_projects/sib/</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://leeannvc.com/es/tech_projects/sib/</guid><description>&lt;h2 id="descripción-general"&gt;Descripción General&lt;/h2&gt;
&lt;p&gt;Este proyecto consistió en diseñar y analizar conjuntos de datos sociolingüísticos para investigar la variación en el habla en español. Demuestra experiencia integral en la creación de datos, el diseño de anotaciones, el aseguramiento de la calidad y el análisis estadístico.&lt;/p&gt;
&lt;h2 id="mi-rol"&gt;Mi Rol&lt;/h2&gt;
&lt;ul&gt;
&lt;li&gt;Diseñé
para variables lingüísticas inéditas&lt;/li&gt;
&lt;li&gt;Gestioné la recolección, curación y flujos de trabajo de QA del conjunto de datos&lt;/li&gt;
&lt;li&gt;Supervisé y formé a anotadores estudiantes&lt;/li&gt;
&lt;li&gt;Lideré el ciclo de investigación completo, desde el diseño de datos hasta el modelado estadístico&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id="datos-y-métodos"&gt;Datos y Métodos&lt;/h2&gt;
&lt;ul&gt;
&lt;li&gt;Construí y analicé conjuntos de datos de más de 70,000 tokens&lt;/li&gt;
&lt;li&gt;Realicé codificación,
y
en R&lt;/li&gt;
&lt;li&gt;Apliqué
para investigar la variación lingüística&lt;/li&gt;
&lt;li&gt;Desarrollé flujos de trabajo para la consistencia de anotaciones y la calidad de los datos&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id="resultados"&gt;Resultados&lt;/h2&gt;
&lt;ul&gt;
&lt;li&gt;Produje conjuntos de datos estructurados para el análisis de la variación en español&lt;/li&gt;
&lt;li&gt;Generé hallazgos que contribuyeron a la
&lt;/li&gt;
&lt;li&gt;Demostré enfoques escalables para la anotación de datos lingüísticos y el QA&lt;/li&gt;
&lt;/ul&gt;</description></item></channel></rss>