Pastein: 1. Мәтінді жеке сөздерге немесе фрагменттерге бөлу Жауап: Токенизация (Tokenization)

Загрузка данных
1. Мәтінді жеке сөздерге немесе фрагменттерге бөлу
Жауап: Токенизация (Tokenization) — мәтінді жеке сөздерге, белгілерге немесе фрагменттерге бөлу процесі. Мысалы: «Жасанды интеллект» → [«Жасанды», «интеллект»].
2. Мәтінді сандық форматқа ауыстыру
Жауап: Векторизация (Vectorization / Embedding) — әр сөзге немесе токенге сандық вектор немесе индекс беру процесі. Мысалы: «кесте» → [0.21, -0.54, 0.87].
3. Мағыналық жүктемесі аз көмекші сөздерді өшіру
Жауап: Стоп-сөздерді алып тастау (Stop-word removal) — «және», «бірақ», «да», «не», «бұл» сияқты мәні аз сөздерді мәтіннен жою.
4. Барлық сөздерді кіші әріпке ауыстыру
Жауап: Нормализация / Lowercasing — барлық сөздерді кіші әріпке түрлендіру. Мысалы: «Жасанды Интеллект» → «жасанды интеллект».
5. Мәтіннен артық символдарды, тыныс белгілерді, сандарды алып тастау
Жауап: Мәтінді тазалау (Text Cleaning) — нүкте, үтір, леп белгі, сандар және басқа артық символдарды жою. Мысалы: «ЖИ, 2024!» → «жи».
6. Виртуалды талдау
Жауап: Виртуалды талдау (Virtual Analysis) — деректерді немесе процестерді цифрлық/модельдік ортада физикалық қатынассыз зерттеу және бағалау тәсілі.
7. Заманауи генеративті интеллектуалды жүйелер
Жауап: Заманауи генеративті ЖИ жүйелері — GPT, Claude, Gemini, DALL-E сияқты мәтін, сурет, код немесе аудио жасай алатын жасанды интеллект модельдері.
8. Ақпараттың бірнеше түрін бір мезетте қабылдап, өңдей және бере алатын жасанды интеллект жүйесі
Жауап: Мультимодалды жүйе (Multimodal AI) — мәтін, сурет, дыбыс, бейне сияқты бірнеше ақпарат түрін бір уақытта қабылдап, өңдей алатын ЖИ жүйесі.
9. Екі немесе одан да көп айнымалылар арасындағы байланысты анықтау әдісі
Жауап: Корреляциялық талдау (Correlation Analysis) — екі немесе одан көп айнымалы арасындағы статистикалық байланысты өлшеу әдісі. Нәтиже -1-ден +1-ге дейінгі корреляция коэффициентімен көрсетіледі.
10. Деректер жиынын алдын ала зерттеу және сипаттау процесі
Жауап: Барластырмалы деректер талдауы (EDA — Exploratory Data Analysis) — деректер жиынын алдын ала зерттеп, оның негізгі сипаттамаларын, заңдылықтарын және ауытқуларын анықтау процесі.
11. Көпқабатты нейрондық желілерге негізделген
Жауап: Терең оқыту (Deep Learning) — бірнеше жасырын қабаттан тұратын нейрондық желілерге негізделген машиналық оқытудың бір бағыты.
12. ЖИ жүйелеріне деректер негізінде өздігінен үйренуге мүмкіндік береді
Жауап: Машиналық оқыту (Machine Learning) — ЖИ жүйелерінің бағдарламалық нұсқаусыз, деректерден автоматты үйренуіне мүмкіндік беретін технология.
13. Адам тілін түсіну және өңдеу технологиясы
Жауап: Табиғи тілді өңдеу (NLP — Natural Language Processing) — компьютерлердің адам тілін оқып, түсініп, жауап беруіне мүмкіндік беретін технология.
14. Суреттер мен бейнелерді тану және талдау
Жауап: Компьютерлік көру (Computer Vision) — ЖИ жүйелерінің суреттерді, бейнелерді талдап, объектілерді тануына мүмкіндік беретін технология.
15. Жасанды интеллекттің (ЖИ) этикалық және құқықтық аспектілері
Жауап: ЖИ этикасы мен заңнамасы — ЖИ жүйелерінің адал, әділ, ашық болуын, жеке деректерді қорғауды, жауапкершілікті және адам құқықтарын сақтауды қамтамасыз ететін нормалар жиынтығы.
16. ЖИ компанияларға клиенттердің мінез-құлқын жақсы түсінуге көмектесетін сала
Жауап: Маркетинг және CRM саласы — ЖИ тұтынушылардың мінез-құлқын, сатып алу үрдістерін талдап, компанияларға мақсатты ұсыныстар жасауға көмектеседі.
17. ЖИ қаржылық операцияларды талдауға және тәуекелдерді басқаруға мүмкіндік беретін сала
Жауап: Қаржы саласы (Finance) — ЖИ алаяқтықты анықтауға, несиелік тәуекелді бағалауға, биржалық болжамдар жасауға және қаржылық операцияларды автоматтандыруға қолданылады.
18. ЖИ ақылды өндіріс жүйелерін дамытуға ықпал ететін сала
Жауап: Өндіріс / Индустрия 4.0 саласы — ЖИ роботтарды басқаруға, өндіріс сапасын бақылауға, жабдықтардың ақауын болжауға (predictive maintenance) қолданылады.
19. ЖИ көлік жүйелерін тиімді әрі қауіпсіз ететін сала
Жауап: Көлік саласы (Transportation) — ЖИ өздігінен жүретін көліктерді, жол талдауын, жүктерді бағыттауды және жол апаттарын болжауды іске асырады.
20. Нейрондық желілердің галлюцинациясы
Жауап: ЖИ галлюцинациясы — нейрондық желінің шынайы деректерге негізделмеген, бірақ сенімді болып көрінетін жалған ақпарат жасауы. Мысалы: жоқ зерттеуді немесе адамды ойдан шығару.
21. Дипфейк дегеніміз не
Жауап: Дипфейк (Deepfake) — жасанды интеллект арқылы адамның бет-пішінін, дауысын немесе бейнесін жасанды түрде ауыстырған немесе жалған жасалған медиамазмұн. Саясат, алаяқтық, дезинформация үшін қауіпті.
22. Деректерді талдау процесінің кезеңдері неге жүйелі түрде орындалуы тиіс және кез келген кезеңді өткізіп жіберу қандай салдарға әкелуі мүмкін
Жауап: Кезеңдер жүйелі болуы керек, себебі әр кезең келесісіне негіз болады. Деректерді тазалаусыз талдасаң — нәтиже бұрмаланады. Зерттеусіз модель жасасаң — маңызды заңдылықтарды байқамайсыз. Кез келген кезеңді өткізіп жіберу қате нәтижеге, жаңылыс шешімдерге немесе модель сәтсіздігіне алып келеді.
23. Ғылыми зерттеулерде деректерді талдаудың маңызы қандай
Жауап: Деректер талдауы ғылыми зерттеулерде гипотезалардың дұрыстығын дәлелдейді, заңдылықтарды анықтайды, нәтижелердің сенімділігін қамтамасыз етеді және қате тұжырымдардың алдын алады.
24. Кәсіби қызметте деректерді талдау қандай артықшылық береді
Жауап: Деректер талдауы кәсіби қызметте: негізделген шешімдер қабылдауға, тиімділікті арттыруға, шығындарды азайтуға, тәуекелдерді болжауға және бәсекелестік артықшылық алуға мүмкіндік береді.
25. Жасанды интеллекттің шешімдерін түсіндіру неге маңызды, әсіресе маңызды салаларда (медицина, қаржы)
Жауап: Медицина мен қаржыда ЖИ шешімі адам өміріне немесе үлкен қаржыға тікелей әсер етеді. Егер шешімнің себебі түсініксіз болса — қате диагноз немесе жаңылыс инвестиция болуы мүмкін. Түсіндірімділік (interpretability) жауапкершілікті, сенімділікті және заңдылықты қамтамасыз етеді.
26. Deepfake технологиясы қоғамға қандай қауіп төндіреді
Жауап: Дипфейк: жалған жаңалықтар таратады, адамдардың беделін жояды, сайлауларға ықпал етеді, алаяқтық схемаларда қолданылады, заңды дәлел ретінде жалған бейнелер ұсынылуы мүмкін. Жалпы қоғамдық сенімді бұзады.
27. Кластерлеу әдісі қандай мақсатта қолданылады және ол қандай нәтижелер береді
Жауап: Кластерлеу (Clustering) — белгіленбеген деректерді ұқсастығы бойынша топтарға бөлу. Мысалы: тұтынушыларды сегменттеуге, аномалияларды анықтауға, гендерлік топтарды бөлуге қолданылады. Нәтиже: деректердегі жасырын топтарды ашады.
28. Машиналық оқыту моделі неге негізделеді
Жауап: Машиналық оқыту моделі деректерге негізделеді. Модель берілген оқыту деректерінен заңдылықтар тауып, жаңа деректерді болжайды. Негіз: математикалық алгоритмдер (регрессия, шешім ағашы, нейрондық желі және т.б.).
29. Деректерді жинау процесінде дереккөздерді дұрыс таңдау неге маңызды және қате дереккөз қандай мәселелерге әкелуі мүмкін
Жауап: Дұрыс дереккөз — сенімді, өзекті және толық деректер береді. Қате дереккөз: бұрмаланған нәтижелер, bias (алалаушылық), жаңылыс болжамдар және модельдің сәтсіздігіне алып келеді. «Қоқыс кірсе — қоқыс шығады» (GIGO принципі).
30. Data Cleaning (деректерді тазалау) кезеңі не үшін міндетті және ол орындалмаса қандай салдар туындайды
Жауап: Деректерді тазалау жетіспейтін мәндерді, қайталанған жазбаларды, қателерді жояды. Орындалмаса: модель қате үйренеді, нәтижелер сенімсіз болады, болжамдардың дәлдігі төмендейді.
31. Деректерді форматтау және стандарттау (formatting) не үшін қажет
Жауап: Форматтау барлық деректерді бір стандартқа келтіреді (мысалы: күн форматы, өлшем бірлігі, регистр). Бұл деректерді дұрыс салыстыруға, талдауға және модельге беруге мүмкіндік береді.
32. Интеллектуалды мәтін өңдеу әдістері (NLP) не үшін қолданылады және олар қандай нақты міндеттерді орындай алады
Жауап: NLP қолданыстары: мәтінді жіктеу, сезімдерді талдау (sentiment analysis), машиналық аударма, чат-боттар, жаңалықтарды қорыту, іздеу жүйелері, спам сүзу.
33. Кескіндерді өңдеуде машиналық оқыту әдістерінің рөлі қандай және олар дәстүрлі әдістерден қалай ерекшеленеді
Жауап: МО әдістері суреттерден автоматты ерекшеліктерді (features) үйренеді. Дәстүрлі әдістер қолмен ережелер жазуды талап етті. МО: үлкен деректерде дәлдігі жоғары, жаңа жағдайларға бейімделе алады.
34. Бейнелерді өңдеуде объектіні тану (object detection) технологиясы қандай мақсатта қолданылады
Жауап: Object detection: қауіпсіздік камераларында адам/автомобиль тануда, медицинада ісік анықтауда, өндірістегі ақауды бақылауда, өздігінен жүретін көліктерде жол белгілерін тануда қолданылады.
35. Интеллектуалды кескін өңдеуде нейрондық желілердің маңызы қандай
Жауап: CNN (Convolutional Neural Networks) — кескіндердің ерекшеліктерін (шет, пішін, текстура) автоматты үйреніп, жоғары дәлдікпен суреттерді жіктейді. Дәстүрлі алгоритмдерден әлдеқайда тиімді.
36. Exploratory Data Analysis (EDA) қандай мақсатта қолданылады
Жауап: EDA деректер жиынын алдын ала зерттеуге, орташа мән, дисперсия, таралу, корреляция секілді негізгі статистикаларды есептеуге, ауытқуларды (outliers) және жетіспейтін мәндерді анықтауға қолданылады.
37. Үлкен деректерді визуализациялау кезінде масштабты дұрыс таңдамау қандай қателікке әкеледі және бұл шешім қабылдауға қалай әсер етеді
Жауап: Қате масштаб: маңызды айырмашылықтарды жасырады немесе болмашы өзгерістерді асыра көрсетеді. Нәтижесінде: жаңылыс трендтер, дұрыс емес шешімдер. Мысалы: Y-осі нөлден басталмаса — кішкентай өзгеріс үлкен болып көрінеді.
38. Pivot Table (жиынтық кесте) деректерді талдауда қандай рөл атқарады және ол не үшін тиімді
Жауап: Pivot Table үлкен деректерді жылдам топтастырып, қорытындылайды. Тиімді себебі: код жазбай-ақ деректерді бұруға, жіктеуге, сомалауға мүмкіндік береді. Excel-де кең қолданылады.
39. Географиялық деректерді визуализациялау (map) бизнес пен мемлекеттік секторда қандай артықшылық береді
Жауап: Карта визуализациясы: сату географиясын, халық тығыздығын, апат аймақтарын, логистика маршруттарын анық көрсетеді. Шешімдерді нақтылап, ресурстарды дұрыс бөлуге көмектеседі.
40. Data storytelling (деректер арқылы әңгімелеу) тәсілі нені білдіреді және ол не үшін қолданылады
Жауап: Data storytelling — деректерді тек кесте немесе график түрінде емес, нақты баяндама, контекст және эмоция арқылы жеткізу тәсілі. Мақсаты: аудитория деректерді жақсы түсінеді және шешім қабылдауда қолданады.
41. Power BI немесе Tableau сияқты құралдарда интерактивті дашбордтардың артықшылығы неде
Жауап: Интерактивті дашборд: деректерді нақты уақытта жаңартады, пайдаланушы сүзгілер арқылы өзі зерттейді, пайдалану оңай (код қажет емес), басшылыққа жылдам шешім қабылдатады.
42. Python тіліндегі Matplotlib, Seaborn, Plotly кітапханаларының негізгі мақсаты қандай
Жауап: Matplotlib — негізгі статикалық графиктер (сызықтық, бағаналы). Seaborn — статистикалық визуализация, Matplotlib-тен әдемірек. Plotly — интерактивті, веб-жарамды графиктер жасайды.
43. Бейне талдауда уақыттық ақпараттың (temporal data) маңызы қандай
Жауап: Уақыттық деректер бейнедегі оқиғалар ретін, қозғалыс динамикасын және өзгерістерді байқауға мүмкіндік береді. Мысалы: адамның жүру траекториясын, апат сәтін немесе бет-пішін өзгерісін анықтауда маңызды.
44. OCR (Optical Character Recognition) технологиясы не үшін қолданылады
Жауап: OCR — суреттер немесе сканерленген құжаттардағы мәтінді цифрлық мәтінге айналдырады. Қолданысы: банктік чектерді өңдеу, паспорт тану, кітаптарды цифрландыру, факс мазмұнын оқу.
45. Аналитикалық құралдар (Excel, Python, Power BI) арасында Python-ның басты артықшылығы қандай
Жауап: Python-ның артықшылықтары: автоматтандыру, үлкен деректерді өңдеу, МО/ЖИ модельдерін жасау, икемділік, ашық бастапқы код (тегін), кең кітапханалар жиынтығы (pandas, numpy, sklearn).
46. Жасанды интеллект жүйелерінде деректердің сапасы неге маңызды және ол нәтижеге қалай әсер етеді
Жауап: Сапасыз деректер: модельдің дұрыс үйренбеуіне, қате болжамдарға және нәтижелердің сенімсіздігіне алып келеді. «Garbage in — garbage out» принципі: кіріс нашар болса — шығыс та нашар болады.
47. ЖИ жүйесінде алгоритмдік қате бейтараптық (bias) дегеніміз не
Жауап: Bias (алалаушылық) — оқыту деректеріндегі теңсіздік немесе жүйелі қате салдарынан модельдің белгілі бір топтарға (жыныс, нәсіл, жас) қатысты бұрмаланған шешімдер шығаруы.
48. ЖИ шешімдерінің түсіндірілетін болуы не үшін қажет
Жауап: Түсіндірімділік (Explainability): ЖИ неге осы шешімді қабылдағанын адамдар түсінуі үшін қажет. Медицина, қаржы, сот салаларында жауапкершілік, сенімділік және заңдылық үшін міндетті.
49. Жеке деректердің қорғалуы бұзылса қандай қауіп пайда болады
Жауап: Жеке деректер бұзылса: жеке басты ұрлау (identity theft), қаржылық шығын, бопсалау, беделге нұқсан, компанияға заңдық жаза. GDPR сияқты заңдар бойынша үлкен айыппұл салынуы мүмкін.
50. ЖИ технологиясында жауапкершілік мәселесі неге күрделі
Жауап: ЖИ шешімінің жауапкершілігі бөлінеді: модель жасаушы, компания, пайдаланушы немесе реттеуші? ЖИ шешімі адамды зақымдаса кім жауап береді? Заңнамада бұл сұрақтарға нақты жауап жоқ, сондықтан күрделі.
51. Деректерді талдау процесінің негізгі мақсаты қандай
Жауап: Деректерді талдаудың мақсаты — шикі деректерден мағынасын табу, заңдылықтар мен трендтерді анықтау, болжам жасау және негізделген шешімдер қабылдауға мүмкіндік беру.
52. Деректерді жинау кезеңінде не орындалады
Жауап: Деректерді жинау кезеңінде: дереккөздер анықталады (сауалнама, сенсор, база, API), деректер жиналады, алғашқы сапасы тексеріледі және сақтауға дайындалады.
53. Data Cleaning (деректерді тазалау) не үшін қажет
Жауап: Деректерді тазалау жетіспейтін мәндерді толтырады немесе жояды, қайталануларды алып тастайды, қателерді түзетеді. Бұл модельдің дұрыс жұмыс істеуінің негізгі шарты.
54. Деректерді өңдеу (processing) кезеңінде не істеледі
Жауап: Өңдеу кезеңінде: деректер форматталады, стандартталады, нормализацияланады, мүмкіндіктер (features) таңдалады немесе жасалады, модельге беруге дайындалады.
55. Талдау (analysis) кезеңінде не қолданылады
Жауап: Талдау кезеңінде: статистикалық әдістер, машиналық оқыту алгоритмдері, корреляциялық талдау, кластерлеу, регрессия, жіктеу (classification) модельдері қолданылады.
56. Деректерді талдау процесінде бастапқы кезең неге ең маңызды болып саналады
Жауап: Бастапқы кезең (деректерді жинау және тазалау) маңызды, себебі кейінгі барлық кезеңдер осыған негізделеді. Бастапқы қате — соңғы нәтиженің қатесіне тікелей алып келеді.
57. Интеллектуалды жүйелерде деректер сапасы төмен болса, ЖИ нәтижесіне қандай әсер етеді
Жауап: Сапасыз деректер: модельді қате үйрету, дәлдіктің төмендеуі, bias пайда болуы, жаңылыс болжамдар және жүйеге деген сенімнің жоғалуына алып келеді.
58. ЖИ қай тілде жиі бағдарламаланады
Жауап: Python — ЖИ мен МО-да ең жиі қолданылатын бағдарламалау тілі. Себебі: қарапайым синтаксис, кең кітапханалар (TensorFlow, PyTorch, scikit-learn), үлкен қоғамдастық.
59. ЖИ жүйелерінде «ақпаратты түсіндіру» (interpretability) не үшін қажет
Жауап: Interpretability ЖИ шешімінің неліктен осылай шыққанын адамдарға түсіндіруге мүмкіндік береді. Бұл сенімділікті арттырады, заңдық талаптарға сай келеді және қателерді анықтауға көмектеседі.
60. Деректерді өңдеу кезінде форматтаудың мақсаты қандай
Жауап: Форматтау барлық деректерді бір стандартқа (күн форматы, өлшем бірлігі, мәтін регистрі) келтіреді. Бұл деректердің үйлесімділігін, дұрыс салыстырылуын және модельге дұрыс берілуін қамтамасыз етеді.
61. Аналитикалық құралдар (Excel, Python, Power BI) не үшін бірге қолданылады
Жауап: Әр құралдың артықшылығы бар: Excel — қарапайым есептер, Python — күрделі талдау мен МО, Power BI — визуализация мен есеп беру. Бірге қолдану толық аналитикалық циклды қамтиды.
62. ЖИ этикасында ашықтық неге маңызды рөл атқарады
Жауап: Ашықтық (Transparency) ЖИ жүйесінің қалай жұмыс істейтінін, деректерді қалай пайдаланатынын және шешімдерін қалай қабылдайтынын адамдарға түсіндіреді. Бұл сенімділіктің, жауапкершіліктің негізі.
63. Big Data ұғымының негізгі ерекшелігі қандай
Жауап: Big Data — өте үлкен, тез өсетін және алуан түрлі деректер жиынтығы. 3V принципімен сипатталады: Volume (көлем), Velocity (жылдамдық), Variety (әртүрлілік). Дәстүрлі құралдармен өңдеу қиын.
64. Кәсіби салаларда деректерді талдау не үшін қажет
Жауап: Кәсіби салаларда деректер талдауы: шешімдерді дәлелдеуге, тиімділікті арттыруға, тәуекелдерді азайтуға, нарықты түсінуге және бәсекелестік артықшылық алуға қажет.
65. ЖИ мен деректерді талдаудың байланысы нені білдіреді
Жауап: ЖИ деректерсіз жұмыс істей алмайды — деректер талдауы ЖИ-ге оқыту материалы береді. Деректер талдауы ЖИ-ді жасауда, бағалауда және жақсартуда негізгі рөл атқарады.
66. ЖИ жүйелеріндегі галлюцинациялар дегеніміз не
Жауап: ЖИ галлюцинациясы — модельдің ақиқатқа сай келмейтін, бірақ сенімді болып көрінетін жалған ақпарат жасауы. Мысалы: жоқ мақаланы, адамды немесе оқиғаны ойдан шығару.
67. Галлюцинациялар көбінесе қай жағдайда пайда болады
Жауап: Галлюцинациялар жиі: оқыту деректерінде ақпарат жетіспегенде, сирек тақырыптарда сұрақ қойғанда, модельді шектен тыс «сенімді» жасағанда немесе деректер қайшы болғанда пайда болады.
68. ЖИ галлюцинацияларын азайту үшінне істеу керек
Жауап: Азайту жолдары: RAG (Retrieval-Augmented Generation) — нақты дереккөздерге сілтеу; деректер сапасын жақсарту; модельді тексеру (fact-checking); пайдаланушыны дереккөзді тексеруге үйрету.
69. Галлюцинациялардың қауіптілігі неде
Жауап: Галлюцинациялар қауіпті: жаңылыс медициналық ақпарат, заңдық қате кеңес, жалған деректерге негізделген шешімдер, жалған жаңалықтар таратуға алып келуі мүмкін.
70. ЖИ галлюцинациялары қай салада ерекше қауіпті
Жауап: Ең қауіпті салалар: медицина (жаңылыс диагноз), заң (дұрыс емес заңдық кеңес), қаржы (жаңылыс инвестициялық шешім), қауіпсіздік (жалған ақпаратқа негізделген іс-қимыл).
71. Жасанды интеллект кәсіби қызметте не үшін қолданылады
Жауап: ЖИ кәсіби қызметте: рутиндік тапсырмаларды автоматтандыру, деректерді жылдам талдау, болжам жасау, клиенттерге қызмет көрсету (чат-боттар), шешімдерді қолдау үшін қолданылады.
72. ЖИ-дің кәсіби қызметтегі артықшылығы қандай
Жауап: ЖИ артықшылықтары: жылдамдық (адамнан жылдам өңдейді), дәлдік (қайталанатын тапсырмаларда), 24/7 жұмыс, үлкен деректермен жұмыс, шаршамайды, субъективті емес.
73. ЖИ жұмыс орындарына қалай әсер етеді
Жауап: ЖИ кейбір қайталанатын жұмыс орындарын автоматтандырады (бухгалтер, оператор), бірақ жаңа мамандықтар жасайды (деректер ғалымы, ЖИ инженері). Жалпы жұмыс нарығын өзгертеді, жоймайды.
74. ЖИ-ді кәсіби салада қолданудың тәуекелі қандай
Жауап: Тәуекелдер: деректер қорғалмауы, bias бар шешімдер, жауапкершіліктің анықсыздығы, тым сенімділік (over-reliance), жұмыс орындарының азаюы, галлюцинациялар.
75. ЖИ-мен жұмыс істейтін маманға қандай дағды қажет
Жауап: Қажетті дағдылар: деректерді талдау, Python/SQL білу, МО негіздері, сыни ойлау, ЖИ этикасын түсіну, домен саласының білімі, нәтижелерді түсіндіру және коммуникация дағдысы.
76. Мәтінді өңдеудің интеллектуалды әдістеріне не жатады
Жауап: NLP әдістеріне: токенизация, стоп-сөздерді жою, лемматизация, сезімдерді талдау, мәтінді жіктеу, аударма, мәтін генерациясы, сұрақ-жауап жүйелері жатады.
77. NLP не үшін қолданылады
Жауап: NLP: машиналық аударма, чат-боттар, іздеу жүйелері, сезімдерді талдау (пікірлерді оқу), спам сүзу, жаңалықтарды қорыту, дауысты тану үшін қолданылады.
78. Компьютерлік көру (Computer Vision) деген не
Жауап: Computer Vision — компьютерлердің суреттер мен бейнелерді адам көзіндей «көріп», талдап, түсінуіне мүмкіндік беретін ЖИ саласы. Объектілерді тану, жіктеу, сегментация кіреді.
79. ЖИ этикасы нені зерттейді
Жауап: ЖИ этикасы: әділдік (fairness), ашықтық (transparency), жауапкершілік (accountability), жеке деректерді қорғау, bias мәселесі, ЖИ-дің адам өміріне ықпалын зерттейді.
80. ЖИ жүйелеріндегі bias деген не
Жауап: Bias — оқыту деректеріндегі немесе алгоритмдегі жүйелі қате салдарынан модельдің белгілі бір топтарға (жыныс, нәсіл) қатысты алалаушылықпен шешім шығаруы.
81. ЖИ-де әділдік не үшін қажет
Жауап: Әділдік (Fairness) ЖИ жүйесінің барлық адамдарға, топтарға тең және объективті қарауын қамтамасыз ету үшін қажет. Алалаушылық дискриминацияға және заңдық мәселелерге алып келеді.
82. ЖИ құқықтық аспектілеріне не жатады
Жауап: Құқықтық аспектілер: жеке деректерді қорғау заңдары (GDPR), зияткерлік меншік, ЖИ шешімдері үшін жауапкершілік, ЖИ реттеу (регуляция), цифрлық қауіпсіздік заңдары.
83. ЖИ шешімдері үшін кім жауап береді
Жауап: Жауапкершілік бөлінеді: модель жасаушы компания, оны қолданатын ұйым және кейде пайдаланушы. Заңнамада бұл нақты белгіленбеген — бұл ЖИ этикасының өзекті мәселесі.
84. Әділдікті (fairness) қалай бағалауға болады
Жауап: Fairness бағалау: топтар бойынша модель нәтижелерін салыстыру, bias метрикаларын өлшеу (disparate impact, equal opportunity), деректер жиынын тексеру, аудит жүргізу.
85. ЖИ жауапкершілігі нені білдіреді
Жауап: ЖИ жауапкершілігі (Accountability) — ЖИ жүйесі келтірген зиян немесе қате шешім үшін нақты адам немесе ұйымның жауап беруін білдіреді. Бұл заңдық және этикалық талап.
86. Privacy (құпиялылық) ұғымы нені білдіреді
Жауап: Privacy — адамдардың жеке ақпаратын (денсаулық, қаржы, орналасу) жинауға, сақтауға және пайдалануға қатысты бақылай алу құқығы. ЖИ жүйелері бұл деректерді заңсыз пайдаланбауы тиіс.
87. Data leakage дегеніміз не
Жауап: Data leakage (деректердің ағуы) — оқыту кезеңінде моделіге тест деректері туралы ақпараттың жасырын кіруі. Нәтижесінде модель жасандай жоғары нәтиже көрсетеді, бірақ нақты жағдайда нашар жұмыс істейді.
88. Transfer learning дегеніміз не
Жауап: Transfer learning (трансферттік оқыту) — бір тапсырмада үйретілген модельді (мысалы: суреттерді тану) басқа ұқсас тапсырмаға (медициналық суреттерді талдау) бейімдеу. Уақыт пен деректерді үнемдейді.
89. Автоматтандырудың (automation) басты артықшылығы қандай
Жауап: Автоматтандыру артықшылықтары: рутиндік тапсырмаларды жылдам орындайды, адам қателіктерін азайтады, шығындарды үнемдейді, 24/7 жұмыс істей алады, өнімділікті арттырады.
90. Object detection міндеті қандай
Жауап: Object detection (объектіні тану) міндеті — суреттегі немесе бейнедегі объектілерді (адам, автомобиль, мысық) анықтап, оларды шеңберге алу (bounding box) және атауын беру.
Больше возможностей при регистрации: