W artykule przedstawiono krótkie informacje o wybranych narzędziach tzw. sztucznej inteligencji wykorzystywanych do rozwoju i badań nad tą dziedziną wiedzy, tworzenia aplikacji biznesowych oraz wspomagania codziennej pracy. Część z nich jest dostępna zupełnie za darmo, często otwartoźródłowa, a z innych można korzystać wykupując odpowiedni plan cenowy.
Biznes i praca (business & work)
ChatGPT
ChatGPT jest inteligentnym modelem językowym opracowanym przez OpenAI. Jego celem jest pomoc użytkownikom w uzyskiwaniu odpowiedzi na pytania, udzielanie informacji i wsparcie w różnych tematach. Jego architektura, GPT-3.5, została wyuczona na szerokim zakresie tekstów, aby móc dostarczać jak najbardziej dokładne odpowiedzi i pomoc w różnych dziedzinach.
Projekt ChatGPT opiera się na sieciach neuronowych i modelowaniu języka naturalnego. Wykorzystuje kontekst wprowadzony przez użytkownika, aby generować odpowiedzi, bazując na wzorcach i informacjach zawartych w treningowym zestawie danych. Jego możliwości obejmują ogólną wiedzę, matematykę, nauki przyrodnicze, technologię, kulturę, rozrywkę i wiele innych obszarów.
Ważne jest jednak zaznaczyć, że jako model językowy ChatGPT nie posiada rzeczywistej świadomości ani subiektywnych doświadczeń. Jego odpowiedzi opierają się na wzorcach w tekście i informacjach, które zostały dostarczone podczas treningu. Chociaż stara się dostarczać jak najbardziej pomocne odpowiedzi, zawsze warto potwierdzić ważne informacje w bardziej wiarygodnych źródłach.
Midjourney
Midjourney służy do generowania zarówno fotorealistycznych jak i abstrakcyjnych obrazów na podstawie opisów tekstowych.
D-ID
chat.D-ID to aplikacja internetowa, która wykorzystuje animację twarzy w czasie rzeczywistym i zaawansowane przetwarzanie tekstu na mowę, aby stworzyć jak najbardziej naturalne wrażenia z konwersacji ze sztuczną inteligencją. Bezpłatna aplikacja pozwala rozmawiać twarzą w twarz z ChatGPT. D-ID dostarcza również produkt, który umożliwia tworzenie mówiących awatarów.
API D-ID jest solidne, skalowalne i bardzo proste w użyciu (wystarczy kilka linii kodu). Obsługuje również strumieniowe generowanie filmów z mówiącymi postaciami, stworzonymi na podstawie plików z obrazem i audio.
DALL-E 2
DALL-E to model generatywny opracowany przez OpenAI, który łączy techniki z dziedziny uczenia maszynowego z generowaniem obrazów. Nazwa DALL-E jest połączeniem nazwy artysty Salvador Dalí i postaci z filmu „Wall-E”. Model DALL-E został stworzony na bazie architektury kodera-dekodera i jest zdolny do tworzenia realistycznych obrazów na podstawie tekstowego opisu.
Stable Diffusion 2
Otwartoźródłowa aplikacja do generowania obrazów na podstawie opisów tekstowych (ang. prompts), której można używać online lub na własnym komputerze po jej zainstalowaniu.
Bing AI
Narzędzie stworzone przez Microsoft, które wykorzystuje technologię AI opartą o model GPT. Można z niego korzystać za pomocą przeglądarki Edge. Za jego pomocą można: streszczać artykuły z aktualnie oglądanej strony, generować obrazy na podstawie krótkiego opisu tekstowego, porozmawiać na jakiś temat.
Akkio
IBM Watson Assistant
Salesforce Einstein
Salesforce Einstein to potężne oprogramowanie, które może pomóc firmom uzyskać wgląd w zachowania klientów, zautomatyzować rutynowe zadania i podejmować decyzje w oparciu o dane. Narzędzie wykorzystuje algorytmy uczenia maszynowego, aby zapewnić analizę predykcyjną, przetwarzanie języka naturalnego i inne możliwości sztucznej inteligencji do zarządzania relacjami z klientami (CRM). Umożliwia automatyzację zadań, np. wprowadzanie danych i kwalifikację potencjalnych klientów oraz personalizację interakcji z klientami, które mogą pomóc zwiększyć produktywność działu sprzedaży oraz zadowolenie samych klientów.
Badania i rozwój (research & development)
Tensorflow
TensorFlow to otwarta biblioteka do uczenia maszynowego stworzona przez Google. Jest jednym z najpopularniejszych narzędzi wykorzystywanych w dziedzinie sztucznej inteligencji i uczenia maszynowego. TensorFlow został zaprojektowany w celu ułatwienia tworzenia, trenowania i wdrażania modeli uczenia maszynowego. Jest szczególnie przydatny do pracy z głębokimi sieciami neuronowymi, które są używane do rozwiązywania skomplikowanych problemów związanych z rozpoznawaniem obrazów, przetwarzaniem języka naturalnego i wieloma innymi obszarami.
TensorFlow opiera się na koncepcji tensorów, które są wielowymiarowymi strukturami danych. Umożliwia to skuteczną manipulację danymi wejściowymi i parametrami modelu, a także wykonywanie obliczeń równolegle na GPU i TPU, co przyspiesza proces uczenia. Jednym z charakterystycznych elementów TensorFlow jest reprezentacja obliczeń za pomocą grafu obliczeniowego. Graf składa się z węzłów reprezentujących operacje matematyczne i tensory przechowujące dane. Ten model obliczeniowy umożliwia efektywną organizację i optymalizację obliczeń.
TensorFlow jest dostępny na wielu platformach, w tym na systemach operacyjnych Windows, macOS i Linux. Biblioteka oferuje również obsługę różnych języków programowania, takich jak Python, C++, Javascript, Java, Go. TensorFlow zapewnia narzędzia do tworzenia, trenowania i oceny modeli uczenia maszynowego. Po wytrenowaniu modelu można go wdrożyć w różnych środowiskach, w tym w chmurze, na urządzeniach mobilnych i w systemach wbudowanych.
PyTorch
PyTorch to popularna biblioteka do uczenia maszynowego i głębokiego uczenia, stworzona pierwotnie przez Facebook. Jest oparta na języku Python i zapewnia wygodne narzędzia do tworzenia, trenowania i wdrażania modeli. Wykorzystuje dynamiczne grafy obliczeniowe co pozwala na elastyczną i interaktywną pracę umożliwiając modyfikację modelu w trakcie jego definiowania i obliczeń. PyTorch obsługuje wydajne operacje na tensorach, które są podstawowymi strukturami danych w bibliotece. Umożliwia to wygodne przeprowadzanie operacji matematycznych i manipulację danymi w modelach uczenia maszynowego. Został zaprojektowany z myślą o modułowości, co oznacza, że jest łatwy do rozszerzania i dostosowywania. Użytkownicy mogą tworzyć własne warstwy, funkcje aktywacji i niestandardowe komponenty modeli, co umożliwia łatwe dostosowanie PyTorch do różnych potrzeb.
Dlib C++
Dlib to nowoczesny zestaw narzędzi C++ zawierający algorytmy uczenia maszynowego i narzędzia do tworzenia złożonego oprogramowania w C++ do rozwiązywania rzeczywistych problemów. Jest używany zarówno w przemyśle, jak i na uczelniach w wielu dziedzinach, w tym w robotyce, urządzeniach wbudowanych, telefonach komórkowych i dużych środowiskach obliczeniowych o wysokiej wydajności. Licencja open source Dlib pozwala na bezpłatne korzystanie z niego w dowolnej aplikacji.
OpenCV
OpenCV to otwartoźródłowa biblioteka oprogramowania przeznaczona do pisania aplikacji wizji komputerowej i uczenia maszynowego. OpenCV został zbudowany w celu zapewnienia wspólnej infrastruktury i przyspieszenia wdrażania aplikacji widzenia komputerowego i percepcji maszynowej w produktach komercyjnych. OpenCV jest na licencji Apache 2, co ułatwia firmom wykorzystanie i modyfikację kodu.
Biblioteka zawiera ponad 2500 zoptymalizowanych algorytmów, w tym zestaw zarówno klasycznych, jak i najnowocześniejszych algorytmów widzenia komputerowego i uczenia maszynowego. Algorytmy te mogą być używane do: wykrywania i rozpoznawania twarzy, identyfikowania obiektów, klasyfikowania ludzkich działań w filmach, śledzenia ruchów kamery, śledzenia poruszających się obiektów, wydobywania modeli 3D obiektów, tworzenia chmur punktów 3D z kamer stereo, łączenia obrazów w celu uzyskania wysokiej rozdzielczości obrazu całej sceny, znajdowania podobnych obrazów w bazie danych obrazów, usuwania efektu czerwonych oczu ze zdjęć zrobionych z lampą błyskową, śledzenia ruchów gałek ocznych, rozpoznawania scenerii i ustalania znaczników w celu nałożenia na nią rzeczywistości rozszerzonej oraz wielu innych zastosowań.
OpenAI gym
Google Colaboratory
Google Colaboratory, znane również jako Colab, to platforma w chmurze udostępniana przez Google, która umożliwia korzystanie ze środowiska Jupyter Notebook do pisania i uruchamiania kodu w języku Python i realizacji zadań związanych z analizą danych, uczeniem maszynowym i wieloma innymi. Colab działa całkowicie w chmurze eliminując potrzebę instalacji lokalnego oprogramowania lub posiadania zaawansowanego sprzętu. Użytkownicy mogą uzyskać dostęp do notatników Colab za pośrednictwem przeglądarki internetowej, a wszystkie obliczenia są wykonywane na serwerach Google.
Jednym z głównych atutów korzystania z Colab jest dostęp do bezpłatnych zasobów GPU (karty graficzne) i TPU (jednostki przetwarzania tensorów). Jest to szczególnie przydatne do zadań związanych z uczeniem maszynowym, które wymagają dużej mocy obliczeniowej. Colab zawiera wiele powszechnie używanych bibliotek i pakietów Python, takich jak NumPy, Pandas, Matplotlib i TensorFlow.
Wielu użytkowników może jednocześnie pracować nad tym samym notatnikiem ułatwiając współpracę w zespołach. Notatniki można również udostępniać, wystarczy podać ich adres URL. Colab integruje się z Google Drive umożliwiając importowanie plików danych i dostęp do własnych zbiorów danych.
Vertex AI
Vertex AI jest kompleksową platformą uczenia maszynowego i sztucznej inteligencji (AI) oferowaną przez Google Cloud. Zapewnia narzędzia i usługi, które umożliwiają łatwe budowanie, trenowanie i wdrażanie modeli uczenia maszynowego w chmurze. Platforma Vertex AI integruje wiele funkcji i ułatwień, aby usprawnić proces tworzenia zaawansowanych rozwiązań.
Vertex AI umożliwia zarządzanie pełnym cyklem życia modelu uczenia maszynowego. Można tworzyć modele, trenować je przy użyciu różnych technik i danych treningowych, oceniać ich skuteczność, optymalizować ich wydajność i wdrażać w różnych środowiskach. Vertex AI wprowadza automatyzację w procesie uczenia maszynowego. Wykorzystuje technologię AutoML (Automated Machine Learning), która umożliwia tworzenie modeli bez potrzeby ręcznego dostosowywania parametrów i konfiguracji. Dzięki temu nawet osoby bez głębokiej wiedzy z zakresu uczenia maszynowego mogą tworzyć skuteczne modele.
Vertex AI oferuje skalowalność obliczeniową, która umożliwia dostosowanie zasobów obliczeniowych do bieżących potrzeb. Użytkownicy mogą korzystać z różnych typów maszyn wirtualnych i zasobów GPU, aby zoptymalizować wydajność procesów uczenia maszynowego. Ściśle integruje się z innymi usługami Google Cloud, takimi jak Google BigQuery, Google Cloud Storage, TensorFlow, Kubeflow i inne.
Google Cloud, w tym Vertex AI, stawia duży nacisk na bezpieczeństwo i prywatność danych. Platforma oferuje funkcje kontroli dostępu, zabezpieczeń sieciowych, szyfrowania danych i narzędzi do zarządzania prywatnością.
Azure Machine Learning
https://azure.microsoft.com/pl-pl/products/machine-learning/
H2O AI
IBM Watson
Zestaw narzędzi i usług AI, których można używać do tworzenia chatbotów, analizowania danych i automatyzacji procesów biznesowych. Oprogramowanie jest przeznaczone przede wszystkim dla profesjonalistów, którzy chcą przetwarzać i analizować duże ilości nieustrukturyzowanych danych przy użyciu algorytmów przetwarzania języka naturalnego (NLP) i uczenia maszynowego (ML). Tymi danymi mogą być tekst, obrazy, dźwięk i inne.
Inne funkcje IBM Watson to obliczenia kognitywne i wizualizacja danych, które umożliwiają symulowanie ludzkich procesów myślowych, analizowanie złożonych problemów i generowanie spostrzeżeń, które byłyby trudne do odkrycia dla ludzi. Zapewnia również narzędzia do tworzenia interaktywnych wizualizacji danych, ułatwiając identyfikację wzorców i trendów w dużych zbiorach danych.
Aplikacje, w których IBM Watson został użyty, obejmują między innymi opiekę zdrowotną, finanse, marketing i obsługę klienta.