VRG

tgarza022@gmail.com

¿Un ChatGPT privado para nuestra propia organización?

¿Qué sería si pudiéramos tener todas las bondades de ChatGPT pero con la información de nuestra organización y sin que esta sea accesible por otros más que por personal específico?

A mi gusto es ahí donde resaltará el potencial del uso de gpt o chatgpt, en l pequeña y mediana empresa. Los grandes corporativos ya tienen acceso a modelos de IA muy sofisticados y muchas de las veces creados por ellos mismos (parte de su presupuesto va a equipos técnicos que desarrollan estas tecnologías muy a la medida), pero el la pequeña y mediana empresa no cuentan con el mismo presupuesto pero ahora con ChatGPT y más que nada con la posibilidad de crear modelos propios ahora sí surgen una posibilidad increíble de hacer más ágiles a esas empresas que comiencen a apostar a la implementación de esto al nivel de sus posibilidades.

En los siguientes posts describiré mi viaje por implementar precisamente un ChatGPT privado cuya función principal será el análisis de los datos de la empresa para la que trabajo, lanzaré esta app en la organización y documentaré las experiencias y opiniones de los involucrados. Mi meta es lograr que los líderes de los diversos departamentos accedan de manera versátil a toda la información de la empresa de una manera más versátil pero aún más importante, que les despierte la curiosidad y les permita descubrir patrones y/o tendencias.

Pero antes de poder llegar a ese objetivo es necesario planear los paso que se deben tomar en cuenta para lograr éxito.

A primera vista el poyecto me parecía sencillo, pero llevando a cabo algunas pruebas pues resulta un tanto más complicado de lo que parecía a primera instancia.

ChatGPT no tiene acceso a datos más que a aquellos con los que se le alimentó antes del 2021; tiene y tendrá acceso a toda gama de datos a través de plugins de terceros, pero aún no es fácil que le acepten a uno publicar plugins pero además la finalidad de estos es el consumo abierto y en nuestro caso solo queremos que nuestra organización tenga acceso. Esto es bueno ya que no querremos que innformación delicada de nuestra empresa sea expuesta casualmente a ojos de un usuario que no debería. Así pues el reto está más que nada en eso, la creación de nuestro propio LLM.

Para generar nuestro propio LLM hay varias etapas a su vez:

  1. Recopilar y preparar los datos: reunir los datos de la organización que se desea utilizar para entrenar el modelo. Estos pueden incluir preguntas frecuentes, diálogos de servicio al cliente, documentos internos o cualquier otro tipo de información relevante. Se debe asegurar de tener una variedad de ejemplos que cubran diferentes temas y situaciones.

  2. Anota tus datos: Para entrenar a ChatGPT, se debe anotar los datos con ejemplos de preguntas y respuestas. Se deben identificar las preguntas o mensajes de los usuarios y las respuestas correspondientes. Esto se puede hacer manualmente o utilizando una herramienta de anotación.

  3. Preprocesamiento de datos: realizar un preprocesamiento básico de los datos. Esto puede incluir la eliminación de información sensible o confidencial, la normalización de texto (como convertir todo a minúsculas), la eliminación de puntuación o caracteres especiales, y cualquier otro procesamiento específico que sea necesario para los datos.

  4. Entrenamiento del modelo: utilizar los datos anotados para entrenar el modelo. Se puede emplear la API de OpenAI para entrenar una versión adaptada de GPT-3.5 o un modelo similar. OpenAI también brinda herramientas y recursos para entrenar modelos de lenguaje personalizados, como la “Plataforma de Aprendizaje por Reforzamiento” (Reinforcement Learning from Human Feedback, RLHF). Para esta estapa se pueden seguir las pautas y documentación proporcionadas por OpenAI para entrenar el modelo.

  5. Evaluación y ajuste: Una vez que se haya entrenado el modelo, es importante evaluar su rendimiento. Habrá que realizar pruebas y evalúar cómo responde a diferentes preguntas y escenarios. Finalmente debemos identificar posibles mejoras y ajustes que se puedan hacer para aumentar la precisión y la utilidad del modelo.

Es importante destacar que el proceso de entrenamiento de un modelo de lenguaje personalizado puede ser complejo y requiere experiencia en el manejo de datos y en el entrenamiento de modelos de aprendizaje automático.

Sabiendo todo lo anterior podrás entender entonces que nuestros modelos estarán limitados a los datos específicos que le proporcionemos, por lo que su capacidad para responder a preguntas fuera de ese dominio puede ser limitada.

Así que en siguientes posts espera avances en mi proceso de creación de un modelo propio (LLM) para nunestro ChatGPT privado.

22 May 2023, @VictorianoGrza