About Taringa!

Popular channels

Microsoft libera el código de Machine Learning Toolkit



Microsoft ha liberado para la comunidad de desarrolladores el código del Distributed Machine Learning Toolkit (DMTK) esta semana.


Investigadores en el laboratorio Microsoft Asia han lanzado el toolkit en Github bajo una licencia MIT(Massachusetts Institute of Technology), para fomentar el uso de multiples computadoras en paralelo para resolver problemas complejos. Su diseño se basa en un framework de programación basado en servidor, que permite que las tareas de aprendizaje de maquinas big data sean fácilmente escalables, y sean ejecutadas de manera flexible y eficiente.





El toolkit contiene dos algoritmos distribuidos de aprendizaje automatico, y usa una API simple para que sea accesible para investigadores y desarrolladores, y para ayudar a reducir la complejidad de componentes de aprendizaje automatico como datos, modelos y entrenamiento. Según el equipo de laboratorio, éste puede ser usado para entrenar un modelo topico con un millon de topicos y un vocabulario de 20 millones de palabras, en una coleccion de documentos web de 200 billones de tokens, usando sólo un clúster de 24 máquinas - un trabajo que previamente requería miles de máquinas.

Microsoft sugiere que el toolkit podría tambien soportar otras tareas complejas incluyendo visión artificial, recognicion de voz y entendimiento textual. Los investigadores dijeron que mas herramientas serian agragadas en nuevas versiones. Al liberar el código, esperan que los investigadores y desarrolladores puedan ayudar a co-desarrollar los algoritmos contenidos en el kit y expandir las aplicaciones potenciales.


El anuncio llega justo unos días después de que Google llanzara su proyecto de aprendizaje artificial de código abierto, TensorFlow. Facebook también lanzó herramientas open source para aprendizaje profundo, como su librería Torch, a comienzos de año.




0No comments yet