El aprendizaje automático está en el centro de la competición entre humanos y... Inteligencia Artificial (IA). Hace unos dos años, se produjo otro gran avance en el ámbito de las máquinas. En este artículo del blog, explicamos por qué esta fecha es significativa, qué es exactamente el aprendizaje automático y por qué este método es tan importante para la economía.
En Póquer AI Libratus fue capaz de vencer a varios campeones en el juego de póquer No-limits Texas Hold'em. Esta noticia se produjo por dos motivos Sensación lo mismo. Por un lado, porque el Faro es una habilidad clave para ganar el partido. En segundo lugar, porque ganar requiere la capacidad de asumir riesgos deliberados. Libratus llegó a jugar tan bien a partir de cierto punto que sus oponentes pensaban que podía ver sus cartas. Hoy, el bot de póquer tiene un nuevo trabajo en el que utiliza las habilidades que entrenó en el juego para un fin completamente distinto. Pero desde el principio.
Libratus se desarrolló y entrenó con el superordenador del Centro de Supercomputación de Pittsburgh, gestionado, entre otros, por la Universidad Carnegie Mellon.
Inhaltsverzeichnis
La verdadera sorpresa en la victoria de la IA del póquer fue: se basó esencialmente en el uso del aprendizaje automático
Por otra parte, la victoria de Libratus fue una sensación menor por otra razón. Hasta ahora Aprendizaje profundo y Redes neuronales como el faro de esperanza en el desarrollo de la inteligencia artificial. Sin embargo, a diferencia de AlphaGo, el éxito de Libratus no se basa en el Deep Learning ni en las redes neuronales. Entonces, ¿cómo consiguió Libratus enseñar a jugar al póquer?
Consejo de lecturaEn esta serie de artículos mostramos diferentes Métodos de aprendizaje automático en.
La sorprendente (y ligeramente abreviada) respuesta a esta pregunta es: Aprendizaje automático. Aunque el aprendizaje profundo también es una forma de aprendizaje automático, los creadores de Libratus se basaron en formas relativamente convencionales de aprendizaje automático. Con todo, esto es motivo suficiente para explicar este concepto con más detalle y explorar el potencial económico del Proyectos de ciencia de datos para ilustrarlo.
Consejo de lecturaEn nuestro artículo básico explicamos todos los conceptos comunes que existen en torno al tema de la AI da.
¿Qué es el aprendizaje automático?
La fórmula más general y no técnica para describir el aprendizaje automático es: A autooptimización Algoritmoque es posible aprender de la experiencia. Si nos quedamos con el bot de póquer Libratus, el funcionamiento de esta habilidad pudo observarse en tiempo real durante el torneo de póquer. El indicio decisivo fue que cuanto más duraba el torneo de póquer, mejor era capaz Libratus de evaluar a su oponente y desarrollar estrategias acertadas.
Aprendizaje automático son fundamentalmente diferentes de las que utilizamos los humanos. En este sentido, la idea de que Libratus puede jugar al póquer de forma similar a los humanos también es errónea. Para ganar al póquer, los humanos necesitan ante todo Dos competencias esencialesTalento matemático o estadístico y conocimiento de la naturaleza humana. En comparación, las máquinas desarrollan sus propios enfoques y estrategias, completamente diferentes.
El método de aprendizaje Libratus: minimización del arrepentimiento contrafactual
Libratus, en cambio, puede ganar al póquer porque procedimientos estadísticos en Perfección dominado. Mientras sigue jugando, hace nuevas suposiciones y las coteja con los resultados respectivos. Si el resultado parcial y la suposición no coinciden, el Estrategia variado y adaptado para futuros traslados.
El método de aprendizaje subyacente se denomina "Minimización del arrepentimiento contrafactual"(más o menos: "Minimización posterior del arrepentimiento"). Después de cada movimiento, la IA vuelve a la decisión anterior, la evalúa y la puntúa según lo alto que sea el "arrepentimiento". Libratus se ha hecho esta pregunta innumerables veces: ¿Cuánto mejor o peor habrían sido los resultados del juego si hubiera tomado decisiones diferentes?
Sin embargo, para comprender el enorme potencial que el aprendizaje automático tiene para la economía, es necesario describir el método con mayor detalle. El aprendizaje automático como método es, sin embargo, mucho más complejo que esta descripción ejemplar en el caso de la IA de póquer Libratus.
Toda la verdad sobre el éxito de Libratus y por qué las empresas deberían preocuparse por el póquer
Como ya se ha indicado, la verdad sobre el éxito de Libratus es un poco más complicada. Esto se debe a que las capacidades de Libratus no se basan "simplemente" en el aprendizaje automático o en el aprendizaje por refuerzo. Más bien, el bot de póquer consiste no sólo en un algoritmo inteligente, sino en un Sistema de un total de tres métodos diferentes de aprendizaje automáticoque trabajan juntos. Libratus se considera un hito importante, entre otras cosas, porque domina un juego en el que gran parte de la Información pertinente oculta restos.
En este contexto, los juegos son un Clave de la realidad. El software inteligente que domina un juego concreto puede, en principio, dominar también los retos del mundo real. Pensamiento estratégico en situaciones en las que no se conoce toda la información, pero no sólo es relevante en el póquer. Un ejemplo son los algoritmos de fijación de precios que determinan automáticamente el precio óptimo que los clientes están dispuestos a pagar por un determinado producto o servicio. Por cierto, la propia IA de póquer Libratus trabaja ahora para el Pentágono, donde ayuda a optimizar las negociaciones diplomáticas y las estrategias de guerra.
El aprendizaje automático es clave para convertir los datos en valor económico añadido
También existen numerosos ámbitos de aplicación de esta habilidad en contextos económicos y en la vida cotidiana. Las situaciones de negociación o los retos en el ámbito de la ciberseguridad pueden entenderse como un juego con información parcialmente oculta. No siempre tiene que tratarse de una IA del calibre de Libratus. También pueden utilizarse programas menos elaborados basados en el aprendizaje automático para Mejorar los procesos de toma de decisiones y alcanzar el éxito económico.
0 comentarios