Содержание
- 2. Сентимент талдау анықтамасы Мәтіннің тоналдығын талдау (сентимент-талдау, ағылш. Sentiment analysis, ағылш. Opinion mining) — мәтіндерде эмоционалды
- 3. Сентимент талдау анықтамасы бұл мәтіндік құжаттардағы пікірлер мен эмоцияларды зерттейтін компьютерлік лингвистиканың саласы. Тоналдылықты талдау (сентимент-анализ)
- 4. Автоматты тоналдылықты талдау жүйелері не үшін қажет? Тоналдылықты талдау және пікір алу жүйелері келесі салаларда практикалық
- 5. СА не себепті маңызды? Клиенттер өз ойлары мен сезімдерін бұрынғыдан да ашық білдіретіндіктен, көңіл-күйді талдау осы
- 6. Мәтіннің тоналдылығын талдау (немесе сентимент-талдау) – Data Science мамандары жұмыс істейтін міндеттердің бірі. Осындай талдаудың көмегімен
- 7. Тоналдылықты талдаудың негізгі мақсаты-мәтіндегі пікірлерді табу және олардың қасиеттерін анықтау. Қандай қасиеттер зерттелетіні тапсырмаға байланысты. Мысалы,
- 8. Жалпы көңіл-күй Біз жоғарыдағы бақылау тақтасынан тиісті графиканы шығарудан бастаймыз.Сіз бұл нәтижелер Trustpilot шолуынан мүлдем өзгеше
- 9. Уақыт бойынша көңіл-күй Деректерді визуализациялаудың бұл үлгісі-классикалық уақыттық диаграмма, нәтижелерді бақылайтын және оларды белгілі бір уақыт
- 10. Рейтинг бойынша көңіл-күй Енді біз мәтіндік пікірімізді алдыңғы Trustpilot нәтижелеріне байланыстыратын нәрсеге көшеміз.TrustPilot - тың әр
- 11. Бірақ барлық шолуларда көңіл-күйдің барлық түрлері бар - біз шолуларымызда нюанстар бар екенін білдік, сондықтан біз
- 12. Тақырып бойынша көңіл-күй Қорытындылай келе, көңіл-күйді талдау бізді деректерімізге қалай тереңдете алатындығын суреттеу үшін тақырып бойынша
- 13. СА қалай жұмыс істейді?
- 14. Пікірді талдау деп аталатын көңіл-күйді талдау табиғи тілді өңдеу (NLP) және интернеттегі сөйлесулердің эмоционалды үнін автоматты
- 15. Көңіл-күйді талдау алгоритмдері үш типтегі әдістердің біріне түседі: Ережеге негізделген: бұл жүйелер автоматты түрде қолмен жасалған
- 16. Ережеге негізделген әдіс Әдетте ережеге негізделген жүйе субъективтілікті, полярлықты немесе пікірдің тақырыбын анықтауға көмектесу үшін адам
- 17. Ережеге негізделген жүйенің қалай жұмыс істейтіні туралы қарапайым мысал:Полярланған сөздердің екі тізімін анықтайды (мысалы, жаман, нашар
- 18. Ережеге негізделген жүйелер өте қарапайым, өйткені олар сөздердің қалай үйлесетінін ескермейді. Әрине, өңдеудің жетілдірілген әдістерін қолдануға
- 19. Корпус жинау. Алдын ала өңдеу Бұл мәтіндер корпусын қолмен жинауға болады немесе осы мақсат үшін арнайы
- 20. Алдын ала өңдеу стемминг – қосымшалардан ажырату: «малюсенький экран»)); стоп-сөздерді өшіру – жиі кездесетін, бірақ мағыналық
- 21. Алдын ала өңдеу төменгі регистрге келтіру (кейбір жағдайларда эмоционалды екпін де жоғалады): «Приобретение данного товара было
- 22. Маңыздарды ерекшелеу Сентименталды талдау кезінде келесі компоненттерді бөліп алу керек: тоналдылық субъекті - пікірдің қайнар көзі,
- 23. Сентимент талдау кезіндегі классификация Мәтін: оң/ теріс Комментарий: мұңды қуанышты ашулы Пікір: оң нейтралды теріс
- 24. Автоматты СА тәсілдері Автоматты әдістер, ережеге негізделген жүйелерден айырмашылығы, қолмен жасалған ережелерге емес, машинаны оқыту әдістеріне
- 26. Оқыту және болжау процестері Оқу процесінде (а) біздің модель оқыту үшін қолданылатын тест үлгілеріне негізделген белгілі
- 27. Мәтіннен функцияларды шығару Машиналық оқыту мәтінін жіктеудегі алғашқы қадам - мәтінді шығаруды түрлендіру немесе мәтінді векторлау,
- 28. Жіктеу алгоритмдері Жіктеу кезеңі әдетте статистикалық модельді қамтиды, мысалы, аңғал Байес, логистикалық регрессия, тірек векторлық машиналар
- 29. Автоматты тоналдылықты талдау тәсілдері Мәтіннің тоналдылығын автоматты түрде анықтаудың негізгі тәсілдерін 2 үлкен топқа бөлуге болады:
- 30. Бағалау лексикасының сөздіктері Бағалау лексикасының сөздігі‑сөздер мен n-компоненттік тізбектер сақталатын мәліметтер базасы-N-граммдар (мысалы, фразеологизмдер және әртүрлі
- 31. Сөздіктердің түрлері Сөздерді тек бір тоналды бағалауға жатқызуға болады – полярлықтың сандық мәні (нөлден үлкен сан
- 32. Сөздіктердің түрлері Сөздерге әр түрлі эмоционалды категориялар жататын лексикондар бар, оларға NRC Word-Emotion Association Lexicon кіреді.
- 33. Сөздіктердің түрлері WordNet-Affect тезаурусында эмоционалды категорияны көрсететін белгілермен ("ашу", "қорқыныш", "таңдану", "қайғы", "жиіркеніш", "қуаныш") және валенттіліктермен
- 34. Лексикалық тәсіл Шаблондар: , Шаблондар бойынша мәтіннен N-грамм алынады. Олардың тоналдылығы сөздіктің көмегімен де, ережелер арқылы
- 35. Лингвистикалық тәсілдегі ережелердің мысалы «Егер …, онда ….» моделі бойынша құрастырылған ережелер Егер тізбекте тізімдегі етістік
- 36. Лингвистикалық тәсілдегі ережелердің мысалы 3. Сөздерді коннотациямен өңдеу ережелері. Коннотациялар-бұл сөздермен байланысты бағалау бірлестіктері. Мәтінде оң
- 37. UGC (user-generated content) мәтіндердің ерекшеліктері Әлеуметтік медиа мәтіндерінің ерекшеліктері: Эмотикондар мен смайликтер; Қате теру; Неологизмдер («пичалька»
- 38. Лингвистикалық тәсілдің кемшіліктері Артықшылығы: жоғары дәлдік Кемшіліктері: ережелер жүйесін құру өте қиын міндет; ережелер мен сөздіктер
- 39. Гибридті Тәсілдер Гибридті жүйелер ережелер мен автоматты әдістерге негізделген қажетті элементтерді бір жүйеге біріктіреді. Бұл жүйелердің
- 40. Сентимент талдаудың артықшылықтары 1) Деректерді масштабта сұрыптау. Сіз мыңдаған твиттерді, тұтынушыларды қолдау сөйлесулерін немесе сауалнамаларды қолмен
- 41. 2) Нақты Уақыттағы Талдау. Көңіл-күйді талдау нақты уақыттағы маңызды мәселелерді анықтай алады, мысалы, әлеуметтік желілердегі PR
- 42. 3) Келісілген критерийлер. Белгілі бір мәтіннің көңіл-күйін анықтауда адамдар тек 60-65% жағдайда келіседі деп есептеледі. Мәтінді
- 43. Сентимент талдаудың жалпы мәселелері Тоналдылықты автоматты түрде анықтаудың кез келген жүйесінде 2 үлкен мәселе кездеседі: Қалжың
- 44. SentiStrength Қысқа бейресми мәтіндегі оң және теріс көңіл-күйдің күшін анықтау Стандартты грамматика мен емленің болмауына байланысты
- 45. SentiStrength 2489 терминдердің оң және теріс мағыналарының тізімі және күшті жақтары (1-ден 5-ке дейін), мысалы ache
- 46. My legs ache. You are the coolest. I hate Paul but encourage him. -2 3 -4
- 47. Экстра сентименттік әдістер spelling correction nicce -> nice booster words alter strength very happy negating words
- 48. SentiStrength күші адамдармен бір-бірімен келіскендей үйлеседі 1-тамаша келісім, 0-кездейсоқ келісім
- 49. СТ қиындықтар: Ирония, сарказм: David Cameron must be very happy that I have lost my job.
- 50. Мысал-бұқаралық ақпарат құралдарындағы ірі іс-шаралардағы көңіл-күй 1 айдағы ағылшын тіліндегі Твиттердегі хабарламалар корпусын талдау (35 миллион,
- 51. Твиттердегі автоматты түрде анықталатын оқиғалар 9 Mar 2010 9 Feb 2010 Proportion of tweets mentioning keyword
- 52. Chile matching posts Sentiment strength Subj. Increase in –ve sentiment strength 9 Feb 2010 9 Feb
- 53. #oscars % matching posts Sentiment strength Subj. Increase in –ve sentiment strength Date and time Date
- 54. Көңіл-күйді талдау табиғи тілді өңдеудегі ең қиын міндеттердің бірі болып табылады, өйткені адамдарға көңіл-күйді дәл талдау
- 56. Скачать презентацию