
-
مدت زمان 04:36:30
-
رای دوره (1 رای)
-
رای شما
-
هزینه دوره 89,000 تومان
-
آزمون آنلاین ندارد
-
سطح متوسط
به دلیل کاربرد زیاد و رشد کلان داده های غیرساختاریافته متنی، نیاز به تحلیل و پردازش متون به شدت احساس می شود . حوزه NLP پردازش زبان طبیعی یکی از جذاب ترین و پرکاربردترین حوزه های علم داده به شمار می آید که در تشخیص احساسات ، نظر کاوی در بهینه سازی کسب و کار، دسته بندی متون ، بهینه سازی موتور جست و جو و سیستم های پیشنهاد دهنده مورد استفاده قرار می گیرد.
هم چنین در این دوره پردازش متن زبان برنامه نویسی پایتون را انتخاب کردیم: از یک جهت به دلیل ساده بودن ساختار دستوری و زبانی و از جهت دیگر به دلیل وجود کتابخانه و ماژول های آماده پردازش متن و یادگیری ماشین که فرصت بیشتری جهت تحلیل به کارشناسان علم داده می دهد.
توضیحاتی مختصر در مورد سرفصل ها و زیر فصل های دوره متن کاوی با پایتون:
فصل نصب ابزارها:
در این فصل طریقه نصب پایتون و آناکوندا، توضیحات خط فرمان و دستورات conda و pip ، طریقه نصب کتابخانه پانداس، numpy، پردازش متن nltk، نصب داده های nltk به روش دستی و از طریق خط فرمان، بررسی خطاهای احتمالی نصب گفته خواهد شد.
زیر فصل متن نظرات هر کاربر:
در این بخش مراحل ایمپورت فایل متنی از صفحات وب، متن یک صفحه وب با ساختار html، یک فایل متنی از درایو و یک فایل اکسل حاوی متن نظرات را با روشهای مختلف به محیط کدنویسی پایتون آموزش شده است.
زیر فصل حذف کلمات اضافه و جداسازی کلمات:
در این بخش به جداسازی کلمات و جداسازی جملات در یک فایل متنی از کتابخانه nltk با ذکر مثال هایی می پردازیم. و یکی از کاربردهای جداسازی کلمات در حذف حروف اضافه را در زبان انگلیسی گزارش می دهیم. سپس به معرفی و نمایش حروف اضافه در زبان های مختلف می پردازیم.
زیر فصل معرفی کرپس های متنی:
در این بخش به تعریف پیکره های متنی، کاربرد و انواع آن در زبان فارسی و انگلسیی می پردازیم. سپس در محیط کدنویسی کرپس های nltk را فراخوانی و معرفی می کنیم. در ادامه با wortdNet، مفهومش و کاربردش در پردازش متن می پردازیم.
معرفی دوره
-
معرفی دورهvideo | lock | 10:21
مقدمه
-
مقدمه ای بر متن کاویvideo | lock | 11:20
نصب پایتون و کتابخانه ها
-
نصب پایتون و آناکونداvideo | lock | 15:03
-
نصب کتابخانه های متن کاویvideo | lock | 20:52
استخراج متن
-
استخراج متنvideo | lock | 18:20
پیش پردازش متن (بخش اول)
-
حذف کلمات اضافه stop words و توکن کردن کلمات tokenizevideo | lock | 16:18
-
آشنایی با corpus ها و WordNet هاvideo | lock | 08:18
-
تشخیص موجودیت های نامدار chunking - NERvideo | lock | 16:02
پیش پردازش متن (بخش دوم)
-
ریشه یابی stemming و lemmatizationvideo | lock | 18:10
-
n-gram هاvideo | lock | 09:52
-
آشنایی با ابزار پردازش متن فارسی (هضم hazm)video | lock | 10:16
پروژه عملی-خلاصه سازی متون
-
خلاصه سازی متن (بخش اول)video | lock | 17:22
-
خلاصه سازی متن (بخش دوم)video | lock | 11:35
-
خلاصه سازی (بخش سوم)video | lock | 10:57
-
خلاصه سازی متن (بخش چهارم)video | lock | 12:49
پروژه عملی-طبقه بندی متون
-
طبقه بندی متون (بخش اول)video | lock | 15:34
-
طبقه بندی متون (بخش دوم)video | lock | 17:12
-
طبقه بندی متون (بخش سوم)video | lock | 13:56
-
طبقه بندی متون (بخش چهارم)video | lock | 22:13


کارشناس ارشد نرم افزار
سلام
از بخش ابزار هضم به بعد لینو دانلود مشکل داره
سلام و وقت بخیر. بررسی شد و مشکلی برای دانلود ویدئو هضم وجود ندارد لطفا دوباره امتحان کنید. ویدئوهای مربوط به دو فصل آخر (پروژه خلاصه سازی متون و طبقه بندی متون) در حال تدوین نهایی است و تا دو روز آیند منتشر می شود.
سلام و وقت بخیر. بررسی شد و مشکلی برای دانلود ویدئو هضم وجود ندارد لطفا دوباره امتحان کنید. ویدئوهای مربوط به دو فصل آخر (پروژه خلاصه سازی متون و طبقه بندی متون) در حال تدوین نهایی است و تا دو روز آینده منتشر می شود.
سلام در بخش تحلیل احساسات یک متن فارسی رو بررسی میکنید یا انگلیسی؟
سلام و درود. متن انگلیسی بررسی می شود.
یک مثال از متن فارسی هم بررسی شده است.
سلام . در دو پروژه آخر اصلا از hazm استفاده نمیشه؟ درسته؟
یک فیلم آموزشی در خصوص استفاده از hazm موجود است.
در قسمت فایل هم ، اکسل مربوط به نظرات سایت دیجی کالا موجود نیست!
در آپدیت جدید این داده ارسال شده است. با تشکر
سلام. فایل دوره متن کاوی بروزرسانی شد و اکسل مربوط به نظرات سایت دیجی کالا قرار داده شده است.
سلام لینک دریافت فایل برام باز نشد لطفا بررسی کنید
بسیار عالی و مفید.
ممنون از شما و مدرس.