پروژه ارائه روشی فازی برای شناسایی الگو های عددی فارسی

تعداد صفحات: 28 فرمت فایل: مشخص نشده کد فایل: 4528
سال: مشخص نشده مقطع: مشخص نشده دسته بندی: مهندسی فناوری اطلاعات IT
قیمت قدیم:۱۴,۴۰۰ تومان
قیمت: ۱۲,۰۰۰ تومان
دانلود فایل
کلمات کلیدی: N/A
  • خلاصه
  • فهرست و منابع
  • خلاصه پروژه ارائه روشی فازی برای شناسایی الگو های عددی فارسی

    تعریف پروژه

     

    تشخیص دست نوشته ها موضوعی است که در سه دهه اخیر مورد مطالعه و بررسی گسترده ای قرار گرفته است و با انفجار تکنولوژی اطلاعات پیشرفت های چشم گیری در این زمینه از تحقیقات اتفاق افتاده است .

    دو روش کلی ومتفاوت  برای شناسایی دست نوشته وجود دارد :on_line و off_line .در سیستم های on_line با استفاده از یک قلم مخصوص بر روی سطحی الکترونیکی روند نوشتن انجام میشود و تشخیص به صورت on_line انجام می گیرد ٬ کاریرد این نوع سیستم ها  در حوزه های امنیتی از جمله امضای دیجیتال می باشد .در سیستم های off_line دست نوشته ها قبلا جمع آوری شده اند و شناسایی بر روی آنها انجام می گیرد٬ کاربرد این نوع سیستم ها در خواندن اتوماتیک چک های بانکی ٬آدرس های پستی [1]٬ خواندن نامه های تجاری و...می باشد[2].

    یکی از کاربرد های موفق از تشخیص دست نوشته ٬ باز شناسی نویسه های نوری [1]  است که جندین سال است که موضوع تحقیقات قرار گرفته است ٬ برای اولین بار فقط کاراکتر های مجزا توسط این سیستم ها مورد شناسایی قرار می گرفتند ودر نتیجه روند تکامل٬ تمام کلمات مورد شناسایی توسط سیستم های ocr قرار گرفتند[3]  اسناد دست نوشته برای شناسایی از طریق این گونه سیستم ها باید کاملا تمیز و با کیفیت بالا باشند.

     

    در این پروژه می خواهم با استفاده از ویژگی های روش فازی روشی برای شناسایی ارقام دست نویس فارسی ارائه دهم  .

    برای شناسایی الگو های اعداد با قلم ها و اندازه های مختلف ، نرمالیزه کردن الگو ها امری اجتناب نا پذیر است ، بدین منظور از پنجره ای با اندازه ثابت استفاده کرده و اعداد را با مقیاس مناسبی در داخل این پنجره قرار می دهیم .

     

     

    مهمترین عامل در شناسایی اعداد و حروف توسط چشم انسان ویژگی های مربوط به هر نویسه است ،چشم به طور طبیعی  در مقایسه ویژگی های حروف و اعداد به صورت فازی عمل می کند روش های مختلفی را می توان برای استخراج ویژگی ها مورد استفاده قرار داد مثلا می توان یک نویسه را به قطعات کوچکتری شامل : خطوط افقی ،عمودی ، مایل و همچنین منحنی های بسته و کمان های محدب ومقعر تجزیه کرد و نحوه اتصال قطعات را مورد بررسی قرار داد . در این پروژه برای استخراج ویژگی از روش چهار خانه استفاده می شود [14,15]

    در این روش یک تصویر با ابعاد64*64 به جدولی با ابعاد 8*8 نگاشته می شود ،بنابر این جدولی شامل 64 خانه خواهد بود که ابعاد هر یک از خا نه های جدول 8*8 است.

    برای هر خانه جدول یک ویژگی استخراج کرده ، ویژگی بر اساس فاصله برداری نرمالیزه در[14]  انتخاب می شود  ،مجموعه داده ای  به عنوان مجموعه مرجع در نظر گرفته می شود و میانگین ، واریانس ، تابع عضویت هر ویژگی و سپس متوسط تابع عضویت برای نمونه های مرجع را به دست می آوریم واز این به بعد هر عددی که به سیستم داده شود ویژگی هایش را استخراج می کنیم و تابع عضویت هر ویژگی را به دست آورده و با نمونه های مراجع مقایسه می شود و شناسایی بر اساس یک روش فازی صورت می گیرد.

    در این پروژه دو تابع فازیگر را معرفی کرده ، در قسمت  های بعدی به چگونگی و جزییات مراحل کار می پردازم .

     

    مروری بر کار های انجام شده

     

    همان طور که گفته شد یکی از کاربرد های موفق از تشخیص دست نوشته ٬ باز شناسی نویسه های نوری [2]  است که چندین سا ل است که موضوع تحقیقات قرار گرفته است ٬ برای اولین بار فقط کاراکتر های مجزا توسط این سیستم ها مورد شناسایی قرار می گرفتند ودر نتیجه روند تکامل٬ تمام کلمات مورد شناسایی توسط سیستم های ocr قرار گرفتند[3]  اسناد دست نوشته برای شناسایی از طریق این گونه سیستم ها باید کاملا تمیز و با کیفیت بالا باشند.

    در نتیجه تحقیقات و تلاش های موثر ٬ سیستم هایی برای زبان انگلیسی[4 ]٬ زبان عربی    [5] ٬زبان فارسی٬ [1]زبان چینی[6]و دست نوشته های عددی [7] فراهم است.

    اولین گام برای تبدیل تصویر به اطلاعات قابل فهم برای کامپیوتر ٬ پارامتریک کردن عملیات است . لذا اولین عملیاتی که بر روی تصویر انجام می دهیم عملیات پیش پردازش تصویر است که می خواهیم بعضی از متغیر های ناخواسته را که باعث پیچیدگی پروسه تشخیص می شوند را کاهش دهیم ٬ عملیاتی مانند اصلاح کجی ها ٬ هموار سازی ٬ نرمالیزه کردن٬ بخش بندی[3] و.. یر روی تصاویر اعمال می کنیم. [8]

    بعد از این مرحله باید ویژگی ها را استخراج کنیم٬در[9] برای انتخاب ویژگی ها ٬ روشhmm دو بعدی را انتخاب کرده است و سپس یک روش دسته بندی را برای شناسایی انتخاب کرده٬ روش های دسته بندی کننده نیز بسیار مختلف است٬   از جمله دسته بندی کننده

    های svm ,neural networks, ,knn. .[10,11]

     روش های زیادی برای استخراج ویژگی ها وجود دارد اما مسئله اصلی که در این رابطه وجود دارد پیدا کردن روش های استخراج ویژگی نیست بلکه به دنبا ل پیدا کردن بهترین روش برای استخراج ویژگی ها هستیم [12]

    در [7] روشی جدید برای استخراج ویژگی ها در نظر گرفته شده است ،ویژگی های استخراج شده توالی توزیع ،barr-feature ،different projecrtion ،different profile می باشد و برای شناسایی شبکه عصبی را انتخاب کر ده است .

     

    در [14],[15] با استفاده از ویژگی های روش فازی در مدلسازی نحوه استدلال مغز برای برخورد با پدیده مبهم ،روشی برای شناسایی الگو های عددی دست نویس و تایپ شده با  قلم ها و اندازه های مختلف ارائه می شود.و روش چهار خانه[4] را برای استخراج ویژگی انتخاب کرده اند .

     

    تحلیل موضوع

    من برای تشخیص ارقام دست نویس یک سیستم off-line را پیشنهاد کردم که این سیستم به سه مرحله تقسیم می شود[7]

    پیش پردازش[5]

    استخراج ویژگی ها[6]

    شناسایی[7]

     

    پیش پردازش 

     

       هدف عملیات پیش پردازش در پردازش تصویر٬ آماده کردن و تمیز کردن تصویر برای مراحل دیگر سیستم ocr می باشد. مجموعه عملیاتی که در این مرحله انجام می دهیم متفاوت است

    موارد زیر عملیات پیش پردازش را تحت پوشش قرار می دهد: [8]

    طرح صفحه ورودی، scaning، سایز بندی و حذف کردن لکه ها و تیرگی های موجود در تصویرو....

    در این پروژه عملیاتی را که من به عنوان پیش پردازش انجام میدهم به شرح زیر است:

    فیلترینگ تصاویر:

    تصاویری که ما از اعداد در اختیار داریم ممکن است به دلایل  مختلفی از جمله شرایط bad writing ٬ شرایط بد فراگیری٬  وضعیت نویسنده و... آغشته باشد که باید در این مرحله پس از شناسایی نویز تصویر ٬ فیلترینگ مناسب را برای حذف نویز انتخاب کنیم  مثلا ممکن است تصاویر آغشته به نویز نمک وفلفل باشند که با چشم نیز دیده می شود که برای حذف آن می توانیم فیلتر میانه را اعمال کرده و به راحتی نویز را از تصویر حذف کنیم .

  • فهرست و منابع پروژه ارائه روشی فازی برای شناسایی الگو های عددی فارسی

    فهرست:

     

    تعریف پروژه

     

    مروری بر کار های انجام شده

     

    تحلیل موضوع

     

              -- پیش پردازش

              -- استخراج ویژگی ها

              -- شناسایی

     

          - مجموعه فازی و انتخاب تابع عضویت

     

    تحلیل کد های استفاده شده در شبیه سازی

     

    شبیه سازی و ارائه نتایج تجربی

     

    بررسی مزایا و معایب روش موجود

     

    پیوست

     

    مراجع

     

    منبع:

     

     [1]   Hossein Khosravi a,b,*, Ehsanollah Kabir,” Introducing a very large dataset of handwritten Farsi digits and a study on their varieties”, Pattern Recognition Letters 28 (2007) 1133–1141

     

     [2]    Ernst M. Kussul, Member, IEEE, Tatiana N. Baidyk, Donald C. Wunsch II, Fellow, IEEE, Oleksandr Makeyev, Associate Member, IEEE, and Anabel Martín,” Permutation Coding

    Technique for Image Recognition Systems”, IEEE TRANSACTIONS ON NEURAL NETWORKS, VOL. 17, NO. 6, NOVEMBER 2006

     

     

       [3]   S. Mori, C. Y. Suen and K. Yamamoto, “historical review of OCR research and development”, proceedings of the IEEE, Vol. 80, No. 7, 1992, pp. 1029-1058.

     

     

      [4]   J. Hu, M. K. Brown and W Turin, “HMM     based on-line handwriting recognition”, IEEE Transactions on Pattern Analysis and Machin Intelligence, Vol. 18, October . 1996, pp. 1039-1045.

     

     

    [5]  A. Amin, "Off-line Arabic character recognition – the state of the art  [review]", Pattern Recognition, vol. 31, No. 5, 1998, pp. 517-530.

     

     

    [6]   Ke Liu, Yea S. Huang, and Ching Y. Suen image. A geometrical graph-based approach is developed for the,” Identification of Fork Points on the Skeletons of Handwritten Chinese Characters, IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, VOL. 21, NO. 10, OCTOBER 1999

     

     

      [7]   Salim Ouchtati, Bedda Mouldi and Abderrazak Lachouri,” Segmentation and Recognition of Handwritten

    Numeric Chains “INTERNATIONAL JOURNAL OF INFORMATION TECHNOLOGY VOLUME 4 NUMBER 1 2007 ISSN 1305-2403

     

     

    [8]  Alexander K. Seewald,” Digits - A Dataset for Handwritten Digit Recognition”, Austrian Research Institute for Arti_cial Intelligence

    Freyung 6/6, A-1010 Vienna, Austria

     

     

     [9] Jay Wierer and Nigel Boston,” A HANDWRITTEN DIGIT RECOGNITION ALGORITHM USING TWO-DIMENSIONAL

    HIDDEN MARKOV MODELS FOR FEATURE EXTRACTION”, University of Wisconsin - Madison

    Department of Electrical and Computer Engineering

     

     

       [10]   Ernesst kussul,tatyana baidyk, “improvement method of handwritten digit recognition”, Cd.Universitaria A.P.70-186 C.P.04510 Mexico, D.F.

     

     

    [11] Ernst Kussul*, Tatiana Baidyk ,” Improved method of handwritten digit recognition

    tested on MNIST database” Image and Vision Computing 22 (2004) 971–981

     

     

      [12]     Oivid Due Trier, Anil K. Jain, & Torfinn Taxt, “Feature extraction methods for character recognition – a survey”, Pattern recognition, Vol. 29, No. 4, 1996, pp.641-662.

     

     

      [13]     Simone Marinai, Marco Gori, Fellow, IEEE, and Giovanni Soda, Member, IEEE Computer Society, Artificial Neural Networks for Document Analysis and Recognition

    IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, VOL. 27, NO. 1, JANUARY 2005

     

    [14]  M. Hanmandlua, K.R. Murali Mohanb; ∗, Sourav Chakrabortyc, Sumeer Goyald, Unconstrained handwritten character recognition based on fuzzy logic, Pattern Recognition 36 (2003) 603 – 623

    [15] حسین ابراهیم نژا د ،دانشجوی دکترا مهندسی برق، غلامعلی منتظر ،استادیار مهندسی فناوری اطلاعات ،ارائه روش بهبود یافته فازی برای شناسایی الگو های عددی فارسی 11 International CSI Computer Conference (CSICC’2006), School of Computer Science, IPM, Jan. 24-26, 2006, Tehran, Iran

پروپوزال در مورد پروژه ارائه روشی فازی برای شناسایی الگو های عددی فارسی, گزارش سمینار در مورد پروژه ارائه روشی فازی برای شناسایی الگو های عددی فارسی, تز دکترا در مورد پروژه ارائه روشی فازی برای شناسایی الگو های عددی فارسی, رساله در مورد پروژه ارائه روشی فازی برای شناسایی الگو های عددی فارسی, پایان نامه در مورد پروژه ارائه روشی فازی برای شناسایی الگو های عددی فارسی, تحقیق در مورد پروژه ارائه روشی فازی برای شناسایی الگو های عددی فارسی, مقاله در مورد پروژه ارائه روشی فازی برای شناسایی الگو های عددی فارسی, پروژه دانشجویی در مورد پروژه ارائه روشی فازی برای شناسایی الگو های عددی فارسی, تحقیق دانشجویی در مورد پروژه ارائه روشی فازی برای شناسایی الگو های عددی فارسی, مقاله دانشجویی در مورد پروژه ارائه روشی فازی برای شناسایی الگو های عددی فارسی, پروژه دانشجویی درباره پروژه ارائه روشی فازی برای شناسایی الگو های عددی فارسی
ثبت سفارش
عنوان محصول
قیمت