Aprendizaje automático en el casino: Por qué las empresas deberían preocuparse por ganar al póquer

El aprendizaje automático está en el centro de la competición entre humanos y... Inteligencia Artificial (IA). Hace unos dos años, se produjo otro gran avance en el ámbito de las máquinas. En este artículo del blog, explicamos por qué esta fecha es significativa, qué es exactamente el aprendizaje automático y por qué este método es tan importante para la economía.

En Póquer AI Libratus fue capaz de vencer a varios campeones en el juego de póquer No-limits Texas Hold'em. Esta noticia se produjo por dos motivos Sensación lo mismo. Por un lado, porque el Faro es una habilidad clave para ganar el partido. En segundo lugar, porque ganar requiere la capacidad de asumir riesgos deliberados. Libratus llegó a jugar tan bien a partir de cierto punto que sus oponentes pensaban que podía ver sus cartas. Hoy, el bot de póquer tiene un nuevo trabajo en el que utiliza las habilidades que entrenó en el juego para un fin completamente distinto. Pero desde el principio.

YouTube

Al cargar el vídeo aceptas la política de privacidad de YouTube.
Más información

cargar Vídeo

Libratus se desarrolló y entrenó con el superordenador del Centro de Supercomputación de Pittsburgh, gestionado, entre otros, por la Universidad Carnegie Mellon.

La verdadera sorpresa en la victoria de la IA del póquer fue: se basó esencialmente en el uso del aprendizaje automático

Por otra parte, la victoria de Libratus fue una sensación menor por otra razón. Hasta ahora Aprendizaje profundo y Redes neuronales como el faro de esperanza en el desarrollo de la inteligencia artificial. Sin embargo, a diferencia de AlphaGo, el éxito de Libratus no se basa en el Deep Learning ni en las redes neuronales. Entonces, ¿cómo consiguió Libratus enseñar a jugar al póquer?

Consejo de lecturaEn esta serie de artículos mostramos diferentes Métodos de aprendizaje automático en.

La sorprendente (y ligeramente abreviada) respuesta a esta pregunta es: Aprendizaje automático. Aunque el aprendizaje profundo también es una forma de aprendizaje automático, los creadores de Libratus se basaron en formas relativamente convencionales de aprendizaje automático. Con todo, esto es motivo suficiente para explicar este concepto con más detalle y explorar el potencial económico del Proyectos de ciencia de datos para ilustrarlo.

Consejo de lecturaEn nuestro artículo básico explicamos todos los conceptos comunes que existen en torno al tema de la AI da.

¿Qué es el aprendizaje automático?

La fórmula más general y no técnica para describir el aprendizaje automático es: A autooptimización Algoritmoque es posible aprender de la experiencia. Si nos quedamos con el bot de póquer Libratus, el funcionamiento de esta habilidad pudo observarse en tiempo real durante el torneo de póquer. El indicio decisivo fue que cuanto más duraba el torneo de póquer, mejor era capaz Libratus de evaluar a su oponente y desarrollar estrategias acertadas.

Aprendizaje automático son fundamentalmente diferentes de las que utilizamos los humanos. En este sentido, la idea de que Libratus puede jugar al póquer de forma similar a los humanos también es errónea. Para ganar al póquer, los humanos necesitan ante todo Dos competencias esencialesTalento matemático o estadístico y conocimiento de la naturaleza humana. En comparación, las máquinas desarrollan sus propios enfoques y estrategias, completamente diferentes.

El método de aprendizaje Libratus: minimización del arrepentimiento contrafactual

Libratus, en cambio, puede ganar al póquer porque procedimientos estadísticos en Perfección dominado. Mientras sigue jugando, hace nuevas suposiciones y las coteja con los resultados respectivos. Si el resultado parcial y la suposición no coinciden, el Estrategia variado y adaptado para futuros traslados.

El método de aprendizaje subyacente se denomina "Minimización del arrepentimiento contrafactual"(más o menos: "Minimización posterior del arrepentimiento"). Después de cada movimiento, la IA vuelve a la decisión anterior, la evalúa y la puntúa según lo alto que sea el "arrepentimiento". Libratus se ha hecho esta pregunta innumerables veces: ¿Cuánto mejor o peor habrían sido los resultados del juego si hubiera tomado decisiones diferentes?

Sin embargo, para comprender el enorme potencial que el aprendizaje automático tiene para la economía, es necesario describir el método con mayor detalle. El aprendizaje automático como método es, sin embargo, mucho más complejo que esta descripción ejemplar en el caso de la IA de póquer Libratus.

Toda la verdad sobre el éxito de Libratus y por qué las empresas deberían preocuparse por el póquer

Como ya se ha indicado, la verdad sobre el éxito de Libratus es un poco más complicada. Esto se debe a que las capacidades de Libratus no se basan "simplemente" en el aprendizaje automático o en el aprendizaje por refuerzo. Más bien, el bot de póquer consiste no sólo en un algoritmo inteligente, sino en un Sistema de un total de tres métodos diferentes de aprendizaje automáticoque trabajan juntos. Libratus se considera un hito importante, entre otras cosas, porque domina un juego en el que gran parte de la Información pertinente oculta restos.

En este contexto, los juegos son un Clave de la realidad. El software inteligente que domina un juego concreto puede, en principio, dominar también los retos del mundo real. Pensamiento estratégico en situaciones en las que no se conoce toda la información, pero no sólo es relevante en el póquer. Un ejemplo son los algoritmos de fijación de precios que determinan automáticamente el precio óptimo que los clientes están dispuestos a pagar por un determinado producto o servicio. Por cierto, la propia IA de póquer Libratus trabaja ahora para el Pentágono, donde ayuda a optimizar las negociaciones diplomáticas y las estrategias de guerra.

El aprendizaje automático es clave para convertir los datos en valor económico añadido

También existen numerosos ámbitos de aplicación de esta habilidad en contextos económicos y en la vida cotidiana. Las situaciones de negociación o los retos en el ámbito de la ciberseguridad pueden entenderse como un juego con información parcialmente oculta. No siempre tiene que tratarse de una IA del calibre de Libratus. También pueden utilizarse programas menos elaborados basados en el aprendizaje automático para Mejorar los procesos de toma de decisiones y alcanzar el éxito económico.

Puede obtener más información sobre el aprendizaje automático en el Estudio de investigación CRISP

Autor:inside

Michaela Tiedemann

Michaela Tiedemann forma parte del equipo de Alexander Thamm GmbH desde sus inicios. Ha participado activamente en el proceso de transformación de una empresa emergente, espontánea y dinámica en una empresa de éxito. Con la fundación de su propia familia, comenzó para Michaela Tiedemann un capítulo completamente nuevo. Sin embargo, dejar su trabajo no era una opción para la nueva madre. En su lugar, desarrolló una estrategia para conciliar su trabajo como Directora de Marketing con su papel de madre.

0 comentarios