پردازش زبان طبیعی در پایتون (بخش سوم)

پردازش زبان طبیعی در پایتون (بخش سوم)

1395 اسفند,17
|
0 نظرات
نوشته شده : امیر جوادی

متن و لیست کلمات 

 متن چیست؟ در گام اول متن توالی سمبل های یک صفحه است و دو گام دوم توالی بخش ها و به همین صورت هربخش توالی پاراگراف در نهایت می تونیم بگیم که متن توالی کلمات هست.
برای نمایش یک متن در پایتون:

Call me Ishmael.
خوب شما اکنون میتونیم جملات داخل کتاب nltk رو هم ببینید..(from nltk.book import * این دستور را در صورت خطا دادن وارد کنید)

و همچنین ما میتونیم این جملات رو به هم متصل کنیم

و یا

و برای اضافه کردن یک کلمه از append استفاده میکنیم

شاخص ها در لیست
همانطوری که تاکنون دیدیم ما تونستیم یک متن رو به صورت لیستی از کلمات در پایتون ذخیره کنیم.و با استفاده از دستورات تعداد کلمات یک متن (len) و یا تعداد تکرار یک کلمه در متن (text1.count(“a”)) را بدست بیاوریم
اما سوالی که اینجا پیش میاید ایا ما می توانیم به یک کلمه در موقعیت خاصی درون متن دست بیابیم بله خیلی ساده با توجه به ایندکس اون میتوانیم

اما اگر بخواهیم اولین مکانی یا شاخصی که کلمه در متن ظاهر شده است از index استفاده میکنیم

گاهی پیش میاید که یک رج از کلمات داخل متن را برگردانیم و می توان از این روش استفاده نمیاییم

و اگر شاخصی رو وارد کنیم که خارج از تعداد جمله و یا ارایه باشد با خطا مواجع میشودیم

خود در صورتی که بخواهیم مثلا از اول تا 5 کلمه text1 را برای نمایش دهد

ویا از شاخص 141525  تا آخرین کلمه text4

مواردی که داره عنوان میشود بیشتر برای نشان دادن توانایی و کار با متون در پایتون است.
پس حداقل یکبار اون ها رو تست بگیرید

متغیر ها در پایتون 

دربخش قبل ما برای دسترسی به متون از text1, text2,…,text9 استفاده میکنیم.این عبارات مارا برای مراجعه به 250000 کلمه فقط با فراخوانی یک یک عبارت فراخوانی می کند.بطور کلی ، ما میتوانیم هر نامی را برای متغیرهایمان خود انتخاب کنیم و در محاسبات خود استفاده نمایید.
در خط زیر متغیری با نام sent تعریف کردیم و بعدا با فراخوانی ان به محتوای ذخیره شده در ان دسترسی پیدا میکنیم.

کد رو میشه اینجوری تفصیر کرد

. variable = expression
متغیر = عبارت


منظور از عبارت در بایتون این هست که این عبارت می تونه نتیجه یک تابع و یا محاسبات و یا یک مقدار ثابت باشد.
نکته کلیدی در این بخش این است که نباید از نام های کلیدی که در پایتون تعریف شده اند برای متغیر استفاده کرد

در بخش بعد با رشته ها و توابع مربوط به آنها بیشتر آشنا می شویم