مقدمه

متن‌کاوی (Text Mining)، دانش استخراج خودکار الگوهای پنهان از متون حجیم است. یکی از علوم مرتبط با متن‌کاوی، پردازش زبان طبیعی (NLP) نام دارد. از مهم‌ترین ابزارهای پردازش زبان طبیعی نیز می‌توان به برچسب‌گذاری ادات سخن (Part of Speech Tagging) اشاره کرد. برچسب‌گذاری خودکار متن، در هر زبانی در دو حوزه مهم پیگیری می‌شود. اول حوزه ریخت‌شناسی (Morphology) (صرف) و دوم گرامر(نحو). در صرف،(1) کلمات جدای از هم، مستقل از یکدیگر و تنها با توجه به ساخت‌شان مورد بررسی قرار می‌گیرند؛ اما در نحو،(2) جایگاه هر کلمه در کنار سایر کلمات مد نظر قرار می‌گیرد. جایگاه صرف نسبت به مباحث نحوی، جایگاه تقدمی است. در واقع، تا زمانی که ساختار صرفی کلمات در یک متن مشخص نشده باشد، ورود به حوزه نحو کاری بی‌سرانجام می‌نماید.

مقدمه

انسان‌ها برای انتقال مقصود خود به مخاطب، از راه‌های مختلفی استفاده می‌کنند. یکی از متداول‌ترین روش‌ها، استفاده از تکلّم (گفتاری و نوشتاری) است. در پردازش سخن، گوینده با به کارگیری کلمات، در قالبی به نام جمله، هدف خود را به مخاطب می‌فهماند. برای فهم هدف متکلّم لازم است مخاطب، جملات او را از جنبه‌های گوناگون مانند: محدوده، معنا،(1) اعراب و ... مورد بررسی قرار دهد و تنها بهره‌‌گیری از تجزیه کلمات و تکیه بر نقش آنها برای تشخیص جمله کافی نیست. شناخت محدوده جمله که تعیین ابتدا و انتهای جملات است، نخستین مرحله پردازش جمله به شمار می‌آید. پس از آن، اعراب و لایه‌ معنا‌شناسی قرار دارد.

سه شنبه, 31 خرداد 1390 ساعت 14:55

شناسایی واحدهای اسمی در زبان عربی

مقدمه

پردازش زبان‌ها و مکالمات طبیعی، یکی از اموری ا‌ست که با ورود فناوری رایانه‌ای به زندگی بشر، مورد توجه بسیاری از دانشمندان قرار گرفته است. حتی اندیشه‌ای که تورینگ از ماشین هوشمند خود و تعریفی که او از هوش مصنوعی داشت، در مرحله اول مربوط به پردازش زبان‌های طبیعی می‌شد. تلاش‌های زیادی برای پیگیری این امر صورت گرفت؛ به عنوان مثال، یکی از نتایج قابل توجه این تلاش‌ها ماشین «الیزا»  بود که با تایپ از راه دور با یک انسان، جملات او را پردازش نموده و جوابی درخور آن ارسال می‌نمود. پردازش زبان طبیعی، یکی از عرصه های مهم در علم هوش مصنوعی است.

مقدمه

جهت فهم زبان عربی، سه دانش مهم، نقش اساسی را بر عهده دارند که عبارت‌اند از: علم لغت، صرف و نحو. علم لغت، یعنی فهم معنای حقیقی یک کلمه و همچنین آشنایی با برخی معانی مجازی و کنایی یک کلمه یا یک عبارت.

در کنار علم لغت، علم صرف و نحو نیز وجود دارد که مبتنی بر قواعدی است که فهم هوشمند از آنها را امکان‌پذیر می‌کند. بدون تردید، علم صرف را باید پیش‌نیاز علم نحو دانست. اینکه یک کلمه چه جایگاهی را در یک کلام دارد، ابتدا وابسته به این است که کلمه به خودی خود قابلیت کدام یک از نقوش نحوی را دارد؛ به طور مثال، فاعل یا مفعول شدن یک کلمه، در ابتدا وابسته به این است که آن کلمه اسم باشد و نه فعل یا حرف.

اشاره

مرکز تحقیقات کامپیوتری علوم اسلامی به‌زودی در چارچوب ساختار پژوهشی مورد تأیید وزارت علوم، تحقیقات و فناوری یک نهاد پژوهشی جانبی تأسیس خواهد کرد. آنچه در پی می‌آید، توضیحاتی درباره زمینه‌های فعالیت این نهاد نوپا است که در گام اول، در قالب یک گروه پژوهشی و در گام‌های بعد و توسعه یافته خود، در قالب یک پژوهشکده زیر نظر «مرکز نور» فعالیت خواهد کرد. در اینجا ابتدا با توضیحاتی درباره زمینه علمی فعالیت آن و سپس درباره ساختار سازمانی آن مواجه می‌شوید.

سه شنبه, 31 خرداد 1390 ساعت 14:54

کاربردهای داده کاوی در علوم اسلامی

داده‌کاوی چیست؟

«داده‌کاوی» یا فرایند کشف دانش در پایگاه داده، زمینه‌ای نسبتاً نوظهور است. داده‌کاوی، پل ارتباطی میان علوم آمار، مهندسی کامپیوتر، هوش مصنوعی، شناسایی آماری الگو، یادگیری ماشین و محاسبات رایانشی نرم است. داده‌کاوی، فرآیند یا پروژه‌ای نسبتاً پیچیده برای شناسایی الگوها و مدل‌های صحیح، قابل استناد و مفید در حجم وسیعی از داده است؛ ‌به گونه‌ای که این الگوها و مدل‌ها برای انسان‌ها قابل درک باشند.

اشاره

در دنیای امروز، رشد چشمگیر متون دیجیتالی ایجاب می کند تا با بهره گیری بهینه از فناوری های نوین «متن‌کاوی» و ایجاد سامانه های هوشمند «پردازش زبان طبیعی» برای زبان عربی و فارسی، استخراج اطلاعات علوم اسلامی را از دادگان متنی دیجیتالی کارآمدتر سازیم.

سه شنبه, 31 خرداد 1390 ساعت 14:54

آثار پیشرفت در اندیشه های خلاق

اولین سمینار کامپیوتر و علوم اسلامی، در 18 دیماه سال 1371 در سالن اجتماعات مدرسه عالی دارالشفاء قم با حضور جمعی از بزرگان حوزه، مهندسان و متخصصان، فضلا و دانشجویان رشته‌های کامپیوتر، به همت مرکز تحقیقات کامپیوتری علوم اسلامی برگزار شد.

صفحه3 از3
شما اينجا هستيد:خانه نمایش موارد بر اساس برچسب: پردازش هوشمند متن