W artykule przedstawiono krótkie informacje o wybranych narzędziach tzw. sztucznej inteligencji wykorzystywanych do rozwoju i badań nad tą dziedziną wiedzy, tworzenia aplikacji biznesowych oraz wspomagania codziennej pracy. Część z nich jest dostępna zupełnie za darmo, często otwartoźródłowa, a z innych można korzystać wykupując odpowiedni plan cenowy.

Biznes i praca (business & work)

ChatGPT

ChatGPT jest inteligentnym modelem językowym opracowanym przez OpenAI. Jego celem jest pomoc użytkownikom w uzyskiwaniu odpowiedzi na pytania, udzielanie informacji i wsparcie w różnych tematach. Jego architektura, GPT-3.5, została wyuczona na szerokim zakresie tekstów, aby móc dostarczać jak najbardziej dokładne odpowiedzi i pomoc w różnych dziedzinach.

Projekt ChatGPT opiera się na sieciach neuronowych i modelowaniu języka naturalnego. Wykorzystuje kontekst wprowadzony przez użytkownika, aby generować odpowiedzi, bazując na wzorcach i informacjach zawartych w treningowym zestawie danych. Jego możliwości obejmują ogólną wiedzę, matematykę, nauki przyrodnicze, technologię, kulturę, rozrywkę i wiele innych obszarów.

Ważne jest jednak zaznaczyć, że jako model językowy ChatGPT nie posiada rzeczywistej świadomości ani subiektywnych doświadczeń. Jego odpowiedzi opierają się na wzorcach w tekście i informacjach, które zostały dostarczone podczas treningu. Chociaż stara się dostarczać jak najbardziej pomocne odpowiedzi, zawsze warto potwierdzić ważne informacje w bardziej wiarygodnych źródłach.

https://openai.com/blog/chatgpt

Midjourney

Midjourney służy do generowania zarówno fotorealistycznych jak i abstrakcyjnych obrazów na podstawie opisów tekstowych.

https://www.midjourney.com/

D-ID

chat.D-ID to aplikacja internetowa, która wykorzystuje animację twarzy w czasie rzeczywistym i zaawansowane przetwarzanie tekstu na mowę, aby stworzyć jak najbardziej naturalne wrażenia z konwersacji ze sztuczną inteligencją. Bezpłatna aplikacja pozwala rozmawiać twarzą w twarz z ChatGPT. D-ID dostarcza również produkt, który umożliwia tworzenie mówiących awatarów.

API D-ID jest solidne, skalowalne i bardzo proste w użyciu (wystarczy kilka linii kodu). Obsługuje również strumieniowe generowanie filmów z mówiącymi postaciami, stworzonymi na podstawie plików z obrazem i audio.

https://www.d-id.com/

DALL-E 2

DALL-E to model generatywny opracowany przez OpenAI, który łączy techniki z dziedziny uczenia maszynowego z generowaniem obrazów. Nazwa DALL-E jest połączeniem nazwy artysty Salvador Dalí i postaci z filmu „Wall-E”. Model DALL-E został stworzony na bazie architektury kodera-dekodera i jest zdolny do tworzenia realistycznych obrazów na podstawie tekstowego opisu.

https://openai.com/dall-e-2

Stable Diffusion 2

Otwartoźródłowa aplikacja do generowania obrazów na podstawie opisów tekstowych (ang. prompts), której można używać online lub na własnym komputerze po jej zainstalowaniu.

https://stability.ai/

Bing AI

Narzędzie stworzone przez Microsoft, które wykorzystuje technologię AI opartą o model GPT. Można z niego korzystać za pomocą przeglądarki Edge. Za jego pomocą można: streszczać artykuły z aktualnie oglądanej strony, generować obrazy na podstawie krótkiego opisu tekstowego, porozmawiać na jakiś temat.

Salesforce Einstein

Salesforce Einstein to potężne oprogramowanie, które może pomóc firmom uzyskać wgląd w zachowania klientów, zautomatyzować rutynowe zadania i podejmować decyzje w oparciu o dane. Narzędzie wykorzystuje algorytmy uczenia maszynowego, aby zapewnić analizę predykcyjną, przetwarzanie języka naturalnego i inne możliwości sztucznej inteligencji do zarządzania relacjami z klientami (CRM). Umożliwia automatyzację zadań, np. wprowadzanie danych i kwalifikację potencjalnych klientów oraz personalizację interakcji z klientami, które mogą pomóc zwiększyć produktywność działu sprzedaży oraz zadowolenie samych klientów.

https://www.salesforceairesearch.com/

Badania i rozwój (research & development)

Tensorflow

TensorFlow to otwarta biblioteka do uczenia maszynowego stworzona przez Google. Jest jednym z najpopularniejszych narzędzi wykorzystywanych w dziedzinie sztucznej inteligencji i uczenia maszynowego. TensorFlow został zaprojektowany w celu ułatwienia tworzenia, trenowania i wdrażania modeli uczenia maszynowego. Jest szczególnie przydatny do pracy z głębokimi sieciami neuronowymi, które są używane do rozwiązywania skomplikowanych problemów związanych z rozpoznawaniem obrazów, przetwarzaniem języka naturalnego i wieloma innymi obszarami.

TensorFlow opiera się na koncepcji tensorów, które są wielowymiarowymi strukturami danych. Umożliwia to skuteczną manipulację danymi wejściowymi i parametrami modelu, a także wykonywanie obliczeń równolegle na GPU i TPU, co przyspiesza proces uczenia. Jednym z charakterystycznych elementów TensorFlow jest reprezentacja obliczeń za pomocą grafu obliczeniowego. Graf składa się z węzłów reprezentujących operacje matematyczne i tensory przechowujące dane. Ten model obliczeniowy umożliwia efektywną organizację i optymalizację obliczeń.

TensorFlow jest dostępny na wielu platformach, w tym na systemach operacyjnych Windows, macOS i Linux. Biblioteka oferuje również obsługę różnych języków programowania, takich jak Python, C++, Javascript, Java, Go. TensorFlow zapewnia narzędzia do tworzenia, trenowania i oceny modeli uczenia maszynowego. Po wytrenowaniu modelu można go wdrożyć w różnych środowiskach, w tym w chmurze, na urządzeniach mobilnych i w systemach wbudowanych.

https://www.tensorflow.org/

PyTorch

PyTorch to popularna biblioteka do uczenia maszynowego i głębokiego uczenia, stworzona pierwotnie przez Facebook. Jest oparta na języku Python i zapewnia wygodne narzędzia do tworzenia, trenowania i wdrażania modeli. Wykorzystuje dynamiczne grafy obliczeniowe co pozwala na elastyczną i interaktywną pracę umożliwiając modyfikację modelu w trakcie jego definiowania i obliczeń. PyTorch obsługuje wydajne operacje na tensorach, które są podstawowymi strukturami danych w bibliotece. Umożliwia to wygodne przeprowadzanie operacji matematycznych i manipulację danymi w modelach uczenia maszynowego. Został zaprojektowany z myślą o modułowości, co oznacza, że ​​jest łatwy do rozszerzania i dostosowywania. Użytkownicy mogą tworzyć własne warstwy, funkcje aktywacji i niestandardowe komponenty modeli, co umożliwia łatwe dostosowanie PyTorch do różnych potrzeb.

https://pytorch.org/

Dlib C++

Dlib to nowoczesny zestaw narzędzi C++ zawierający algorytmy uczenia maszynowego i narzędzia do tworzenia złożonego oprogramowania w C++ do rozwiązywania rzeczywistych problemów. Jest używany zarówno w przemyśle, jak i na uczelniach w wielu dziedzinach, w tym w robotyce, urządzeniach wbudowanych, telefonach komórkowych i dużych środowiskach obliczeniowych o wysokiej wydajności. Licencja open source Dlib pozwala na bezpłatne korzystanie z niego w dowolnej aplikacji.

http://dlib.net/

OpenCV

OpenCV to otwartoźródłowa biblioteka oprogramowania przeznaczona do pisania aplikacji wizji komputerowej i uczenia maszynowego. OpenCV został zbudowany w celu zapewnienia wspólnej infrastruktury i przyspieszenia wdrażania aplikacji widzenia komputerowego i percepcji maszynowej w produktach komercyjnych. OpenCV jest na licencji Apache 2, co ułatwia firmom wykorzystanie i modyfikację kodu.

Biblioteka zawiera ponad 2500 zoptymalizowanych algorytmów, w tym zestaw zarówno klasycznych, jak i najnowocześniejszych algorytmów widzenia komputerowego i uczenia maszynowego. Algorytmy te mogą być używane do: wykrywania i rozpoznawania twarzy, identyfikowania obiektów, klasyfikowania ludzkich działań w filmach, śledzenia ruchów kamery, śledzenia poruszających się obiektów, wydobywania modeli 3D obiektów, tworzenia chmur punktów 3D z kamer stereo, łączenia obrazów w celu uzyskania wysokiej rozdzielczości obrazu całej sceny, znajdowania podobnych obrazów w bazie danych obrazów, usuwania efektu czerwonych oczu ze zdjęć zrobionych z lampą błyskową, śledzenia ruchów gałek ocznych, rozpoznawania scenerii i ustalania znaczników w celu nałożenia na nią rzeczywistości rozszerzonej oraz wielu innych zastosowań.

https://opencv.org/

Google Colaboratory

Google Colaboratory, znane również jako Colab, to platforma w chmurze udostępniana przez Google, która umożliwia korzystanie ze środowiska Jupyter Notebook do pisania i uruchamiania kodu w języku Python i realizacji zadań związanych z analizą danych, uczeniem maszynowym i wieloma innymi. Colab działa całkowicie w chmurze eliminując potrzebę instalacji lokalnego oprogramowania lub posiadania zaawansowanego sprzętu. Użytkownicy mogą uzyskać dostęp do notatników Colab za pośrednictwem przeglądarki internetowej, a wszystkie obliczenia są wykonywane na serwerach Google.

Jednym z głównych atutów korzystania z Colab jest dostęp do bezpłatnych zasobów GPU (karty graficzne) i TPU (jednostki przetwarzania tensorów). Jest to szczególnie przydatne do zadań związanych z uczeniem maszynowym, które wymagają dużej mocy obliczeniowej. Colab zawiera wiele powszechnie używanych bibliotek i pakietów Python, takich jak NumPy, Pandas, Matplotlib i TensorFlow.

Wielu użytkowników może jednocześnie pracować nad tym samym notatnikiem ułatwiając współpracę w zespołach. Notatniki można również udostępniać, wystarczy podać ich adres URL. Colab integruje się z Google Drive umożliwiając importowanie plików danych i dostęp do własnych zbiorów danych.

https://colab.research.google.com/

Vertex AI

Vertex AI jest kompleksową platformą uczenia maszynowego i sztucznej inteligencji (AI) oferowaną przez Google Cloud. Zapewnia narzędzia i usługi, które umożliwiają łatwe budowanie, trenowanie i wdrażanie modeli uczenia maszynowego w chmurze. Platforma Vertex AI integruje wiele funkcji i ułatwień, aby usprawnić proces tworzenia zaawansowanych rozwiązań.

Vertex AI umożliwia zarządzanie pełnym cyklem życia modelu uczenia maszynowego. Można tworzyć modele, trenować je przy użyciu różnych technik i danych treningowych, oceniać ich skuteczność, optymalizować ich wydajność i wdrażać w różnych środowiskach. Vertex AI wprowadza automatyzację w procesie uczenia maszynowego. Wykorzystuje technologię AutoML (Automated Machine Learning), która umożliwia tworzenie modeli bez potrzeby ręcznego dostosowywania parametrów i konfiguracji. Dzięki temu nawet osoby bez głębokiej wiedzy z zakresu uczenia maszynowego mogą tworzyć skuteczne modele.

Vertex AI oferuje skalowalność obliczeniową, która umożliwia dostosowanie zasobów obliczeniowych do bieżących potrzeb. Użytkownicy mogą korzystać z różnych typów maszyn wirtualnych i zasobów GPU, aby zoptymalizować wydajność procesów uczenia maszynowego. Ściśle integruje się z innymi usługami Google Cloud, takimi jak Google BigQuery, Google Cloud Storage, TensorFlow, Kubeflow i inne.

Google Cloud, w tym Vertex AI, stawia duży nacisk na bezpieczeństwo i prywatność danych. Platforma oferuje funkcje kontroli dostępu, zabezpieczeń sieciowych, szyfrowania danych i narzędzi do zarządzania prywatnością.

https://cloud.google.com/vertex-ai/

IBM Watson

Zestaw narzędzi i usług AI, których można używać do tworzenia chatbotów, analizowania danych i automatyzacji procesów biznesowych. Oprogramowanie jest przeznaczone przede wszystkim dla profesjonalistów, którzy chcą przetwarzać i analizować duże ilości nieustrukturyzowanych danych przy użyciu algorytmów przetwarzania języka naturalnego (NLP) i uczenia maszynowego (ML). Tymi danymi mogą być tekst, obrazy, dźwięk i inne.

Inne funkcje IBM Watson to obliczenia kognitywne i wizualizacja danych, które umożliwiają symulowanie ludzkich procesów myślowych, analizowanie złożonych problemów i generowanie spostrzeżeń, które byłyby trudne do odkrycia dla ludzi. Zapewnia również narzędzia do tworzenia interaktywnych wizualizacji danych, ułatwiając identyfikację wzorców i trendów w dużych zbiorach danych.

Aplikacje, w których IBM Watson został użyty, obejmują między innymi opiekę zdrowotną, finanse, marketing i obsługę klienta.

https://www.ibm.com/watson