Temat: Reinforcement learning, czyli komputery samodzielnie uczą...

Na tegorocznej konferencji IBM Think Summit 2020 poznamy m.in. możliwości wykorzystania algorytmów RL (reinforcement learning). Co konkretnie może zapewnić ta technologia? I dlaczego może znacznie usprawnić wiele biznesów?

Na czym polega reinforcement learning? Jak tłumaczy Michał Kordyzon, pracujący na stanowisku Cloud Architect, Ecosystem Advocacy Group Member oraz Developer Ecosystem Group Leader w IBM Polska, jest to tzw. uczenie przez wzmacnianie, co jest jedną z dziedzin uczenia maszynowego (machine learning). „W swojej najprostszej formie w algorytmach RL występuje tzw. agent, który podejmuje pewne akcje w określonym środowisku. Następnym elementem algorytmów RL jest funkcja nagrody, która może rosnąć w wyniku podejmowania przez agenta określonych akcji, co determinuje następne działania tego agenta” — mówi. W praktyce oznacza, że algorytm RL może np. nauczyć się jak grać skutecznie w prostą grę typu Flappy Bird lub kółko i krzyżyk.


IBM obserwuje, że firmy już od 2-3 lat coraz częściej interesują się algorytmami RL, choć trzeba przyznać, że ciągle jest to wczesna faza dla tej dziedziny. „Póki co niewielki procent klientów jest w ogóle świadomy istnienia tych algorytmów, i tego jak mogą one pomóc w biznesie” — zauważa Michał Kordyzon. Na tegorocznej konferencji IBM Think Summit, która odbędzie się we wrześniu w Warszawie, z pewnością poznamy wiele ciekawych informacji na temat RL, tym bardziej że jest to dziedzina, która dynamicznie się rozwija. „W każdym miesiącu pojawiają się ciekawe publikacje naukowe albo nowe zastosowania RL w najróżniejszych dziedzinach” — dodaje ekspert.

RL a zastosowanie w praktyce
RL nie jest technologią, o której krążą tylko teorie. Ilość potencjalnych praktycznych zastosowań jest gigantyczna! Algorytmy RL mogą być stosowane z powodzeniem w robotyce, samochodach autonomicznych i innych pojazdach, czy też w systemach informatycznych wykorzystywanych w dostawie i logistyce, sygnalizacji świetlnej, zarządzaniu zasobami w produkcji lub zarządzaniu konsumpcją prądu w budynku. Inaczej mówiąc, algorytmy RL najczęściej sprawdzają się tam, gdzie mamy do czynienia z wielowymiarowym problemem zarządzania dużą ilością zasobów.

Dobry przykład zastosowania RL? ...W przypadku RL zawsze powinniśmy wykonać kilka kroków, aby stworzyć odpowiedni workflow dla systemu: ...
dział IBM w rozwoju reinforcement learningu

IBM inwestuje w RL i zdaje sobie sprawę z tego, jak duży potencjał kryje się w tego typu rozwiązaniach. Michał Kordyzon wyjaśnia, że projektów i produktów w ofercie IBM jest sporo. Wymienia m.in.:
•Cloud Pak for Data - platforma analityczna dla chmury, która wykorzystuje algorytmy RL, np. przy budowie modeli sieci neuronowych. Na tej platformie możliwe jest też utworzenie własnego modelu RL, który wzbogaci biznesowe aplikacje klientów.
•Watson Studio na chmurze IBM Cloud – to z kolei otwarta platforma, na której specjaliści Data Science tworzą modele z wykorzystaniem algorytmów RL. Platformę można używać za darmo w ramach planu Lite, bez podpinania karty kredytowej. Wielu studentów oraz małe firmy chętnie korzystają z tej opcji.
...
https://www.computerworld.pl/news/Reinforcement-learnin...Ten post został edytowany przez Autora dnia 02.08.20 o godzinie 17:01