Generatywna sztuczna inteligencja zdobywa coraz większą uwagę dzięki swojej zdolności do tworzenia tekstu i obrazów. Ale te formy mediów to tylko ułamek danych, które przepływają w naszym społeczeństwie każdego dnia. Dane są generowane za każdym razem, gdy pacjent korzysta z systemu medycznego, burza wpływa na lot, lub gdy ktoś wchodzi w interakcję z aplikacją oprogramowania.

Wykorzystanie generatywnej AI do tworzenia realistycznych scenariuszy testowych

Stosowanie generatywnej AI w celu stworzenia realistycznych syntetycznych danych, na których mogą opierać się te scenariusze, może pomóc organizacjom skuteczniej leczyć pacjentów, przekierowywać samoloty, czy ulepszać platformy oprogramowania. Szczególnie w sytuacjach, gdzie rzeczywiste dane są ograniczone lub wrażliwe.

Od ostatnich trzech lat, spółka wykreowana przez MIT, DataCebo, oferuje system generujący dane o nazwie Synthetic Data Vault (SDV), który pomaga organizacjom tworzyć syntetyczne dane do celów takich jak testowanie aplikacji oprogramowania i szkolenie modeli machine learning.

Sukces projektu Synthetic Data Vault

SDV został pobrany ponad milion razy, a ponad 10 000 specjalistów ds. danych używa tej open-source biblioteki do generowania syntetycznych danych tabelarycznych. Założyciele—Kalyan Veeramachaneni i Neha Patki—są przekonani, że sukces firmy wynika z potencjału SDV do zrewolucjonizowania testowania oprogramowania.

Veeramachaneni i jego zespół w laboratorium Data to AI Lab w 2016 r. opracowali zestaw otwartych narzędzi generatywnych AI, który pomaga organizacjom tworzyć syntetyczne dane, które pasują do statystycznych właściwości rzeczywistych danych. W 2020 r. naukowcy założyli DataCebo, aby umożliwić większym organizacjom rozbudowywanie funkcji w SDV.

Kierunki rozwoju i zastosowania SDV

Chociaż ich narzędzia open-source są używane w różnych sytuacjach, firma skupia się na zastosowaniu SDV w testowaniu oprogramowania. "Potrzebujesz danych, aby przetestować te aplikacje", mówi Veeramachaneni. "Tradycyjnie, programiści samodzielnie piszą skrypty do tworzenia syntetycznych danych. Z modelami generatywnymi, stworzonymi przy użyciu SDV, można uczyć się z próbki zebranych danych, a następnie wygenerować dużą ilość danych syntetycznych, które można potem wykorzystać do testowania ".

Veeramachaneni jest przekonany, że DataCebo jest na czele w dziedzinie, którą nazywa "syntetycznymi danymi przedsiębiorstwa", czyli danymi generowanymi na podstawie zachowań użytkowników korzystających z najpopularniejszych aplikacji. "Dane przedsiębiorstw tego rodzaju są skomplikowane i nie ma do nich powszechnego dostępu, w przeciwieństwie do danych językowych", mówi Veeramachaneni.

Podsumowanie

Podczas gdy firmy we wszystkich branżach spieszą się z adopcją AI i innych narzędzi data science, DataCebo w końcu pomaga im to robić w sposób bardziej transparentny i odpowiedzialny. "W przeciągu najbliższych kilku lat, syntetyczne dane z generatywnych modeli przekształcą całą pracę z danymi", mówi Veeramachaneni. "Wierzymy, że 90% operacji przedsiębiorstw może być wykonanych z danymi syntetycznymi".

Udostępnij ten artykuł
Link został skopiowany!