ايران ويج

نسخه‌ی کامل: اينجكت شن (روش ديكشنري Babylon)
شما در حال مشاهده‌ی نسخه‌ی متنی این صفحه می‌باشید. مشاهده‌ی نسخه‌ی کامل با قالب بندی مناسب.
صفحه‌ها: 1 2 3
ha_60 نوشته است:Babylon از هر دو روش استفاده می کنه یعنی اگه شما روی یه textbox کلیک کنی با استفاده از چند API ساده اونو می گیره که در این حالت اشتباه هم نمی کنه ولی اگه شما روی یه عکس کلیک کنی از OCR استفاده می کنه که در این حالت خطا هم داره در اکثر موارد
ولی در 90% موارد بدون استفاده از OCR این کار رو انجام میده
برای تشخیص متن تو عکس چون با فونت سرو کار دارید و کارکتر نویزی و مخصوصا چرخش و بالا و پایین رفتن خط کرسی در کار نیست فکر میکنم با مقایسه پیکسل به پیکسل دو عکس بهشه به نتیجه رسید اگه سرعت هم پایین باشه می تونید از شبکه های عصبی استفاده کنید البته راندمان پایین مییاد
اتفاقا بر عكس ! 90٪ موارد با استفاده از OCR اين كار رو انجام ميده ! يه فايل مانيتوري چيزي رو سيستمتون اجرا كنيد ، همش اين babylon داره با يه فايل ocrdata ور ميره . آهان راستي ميشه در مورد شبكه هاي عصبي يه توضيحي بدي !؟ ممنون. :wink:
منم به سخن امير جان يه خورده اعتقاد دارم چون تشخيص يك متن نوشته شده در بالاي يه صفحه با OCR نميتونه بي دقت باشه ! :roll:
راستي من احساس ميكنم نوشته توي عكس يه حالت select ميگيره !؟؟ :? براي شما چطور ؟؟
نقل قول: اتفاقا بر عكس ! 90٪ موارد با استفاده از OCX اين كار رو انجام ميده !
چرا وقتی میتونه به راحتی Text رو به دست بیاره بیاد از OCR (البته فکر کنم اشتباه تایپی داشتی چون OCX یه چیز دیگس :wink: ) استفاده کنه این برنامه هایی که پسورد های ستاره دار رو با دراگ کردن در می یارن دیدی این هم همون تور کار می کنه اخه OCR خطای زیادی داره

نقل قول: آهان راستي ميشه در مورد شبكه هاي عصبي يه توضيحي بدي !؟ ممنون
دکتر منهاج در این رابطه یه کتاب فکر کنم 700 صفحه ای نوشته آخرش هم چیز به درد بخوری نگفته Amaze ولی شبکه عصبی در چند خط
اولا هر کی با این شبکه ها آشنا میشه (مثل خودم ) اول فکر می کنه که میشه باهاش آدم نوشت 8O آخه مغز انسان هم تغریبا اینجوری کار می کنه ولی شما جدی نگیرین :wink:
بهترین حسن سرعت بالای این شبکه هاست در پیدا کردن جواب و معایب اصلی هم دقت نه زیاد خوب (یه جواب خوب به آدم میده نه بهترین جواب) البته نسبت به روشهای آماری
واما ساختار : چند تا نرون و آکسون و... داریم که با چند تا ماتریس شبیه سازی میشن و چند تا روش برای آموزش شبکه
شما چند تا ورودی بهش میدی و جواب رو هم بهش می دی بعد شبکه رو آموزش می دی بعد از آموزش شبکه حالا هر ورودی که خواستی (حتی اگه توی ورودی های اول نبوده باشه) بهش می دی و یه جواب خوب می گیری حس این روش اینکه شبکه چیز هایی رو که بهش میدی یاد میگیره (همین جاس که ملت جو میگیرتشونAmaze ) البته شبکه های دیگه ای هم داریم که مثلا برا ی دسته بندی داده ها استفاده میشن و ...
اگه سوال دیکه ای هم داشته باشی در خدمتیم :wink:
Mamad2003 نوشته است:منم به سخن امير جان يه خورده اعتقاد دارم چون تشخيص يك متن نوشته شده در بالاي يه صفحه با OCR نميتونه بي دقت باشه ! :roll:
راستي من احساس ميكنم نوشته توي عكس يه حالت select ميگيره !؟؟ :? براي شما چطور ؟؟
آره ! آره ! مال منم همين جوري ميشه ! بعد تازه يه دفعه هم مچش رو شانسي گرفتم ، هي چند دفه روي يه كلمه كليك كردم ، يهويي كل صفحه نگاتيو شد !! همه رنگهاي توي صفحه بر عكس شد ، من فكر كنم اين يه نگاتيو از صفحه تهيه ميكنه بعد رو اون عمليات انجام ميده .
ha_60 نوشته است:
نقل قول: اتفاقا بر عكس ! 90٪ موارد با استفاده از OCX اين كار رو انجام ميده !
چرا وقتی میتونه به راحتی Text رو به دست بیاره بیاد از OCR (البته فکر کنم اشتباه تایپی داشتی چون OCX یه چیز دیگس :wink: ) استفاده کنه این برنامه هایی که پسورد های ستاره دار رو با دراگ کردن در می یارن دیدی این هم همون تور کار می کنه اخه OCR خطای زیادی داره

نقل قول: آهان راستي ميشه در مورد شبكه هاي عصبي يه توضيحي بدي !؟ ممنون
دکتر منهاج در این رابطه یه کتاب فکر کنم 700 صفحه ای نوشته آخرش هم چیز به درد بخوری نگفته Amaze ولی شبکه عصبی در چند خط
اولا هر کی با این شبکه ها آشنا میشه (مثل خودم ) اول فکر می کنه که میشه باهاش آدم نوشت 8O آخه مغز انسان هم تغریبا اینجوری کار می کنه ولی شما جدی نگیرین :wink:
بهترین حسن سرعت بالای این شبکه هاست در پیدا کردن جواب و معایب اصلی هم دقت نه زیاد خوب (یه جواب خوب به آدم میده نه بهترین جواب) البته نسبت به روشهای آماری
واما ساختار : چند تا نرون و آکسون و... داریم که با چند تا ماتریس شبیه سازی میشن و چند تا روش برای آموزش شبکه
شما چند تا ورودی بهش میدی و جواب رو هم بهش می دی بعد شبکه رو آموزش می دی بعد از آموزش شبکه حالا هر ورودی که خواستی (حتی اگه توی ورودی های اول نبوده باشه) بهش می دی و یه جواب خوب می گیری حس این روش اینکه شبکه چیز هایی رو که بهش میدی یاد میگیره (همین جاس که ملت جو میگیرتشونAmaze ) البته شبکه های دیگه ای هم داریم که مثلا برا ی دسته بندی داده ها استفاده میشن و ...
اگه سوال دیکه ای هم داشته باشی در خدمتیم :wink:
ايول ! خيلي ممنون ازت ، صفا دادي ! برم ببينم ميتونم كتابش رو پيدا كنم . راستي در مورد OCR ببخشيد ، اشتباهي شد OCXAmaze . ولي راست ميگم اين Babylon همشو با OCR در مياره ، تو كه اين كاره اي ، يه file monitor اجرا كن ببين.
هادي خان دمت گرم . 8O
بابا ما تسليم شديم عزيز ! :( اصلا هر چي شما بگي . بابا ايول كه همه فن حريفي . 8) بايد بيايم شاگرديت :wink:
راستي در مورد كتاب هم گفتي .................. اين خارجي ها هم فقط داستان ميگن . چيز عملي اصلا توش نيست .. البته حداقل تا اونجا كه من كتابهاي هوش مصنوعي رو ديدم به زبان انگليسي ! :cry:
نقل قول: هادي خان دمت گرم .
بابا ما تسليم شديم عزيز ! اصلا هر چي شما بگي . بابا ايول كه همه فن حريفي . بايد بيايم شاگرديت
شما لطف دارين من هيچكس نيستم Amaze (ميگن الان " من هيچكس نيستم " مد شدهAmaze )
نقل قول: برم ببينم ميتونم كتابش رو پيدا كنم
کتاب این آقای دکتر رو من اصلا پیش نهاد نمی کنم چون کار چند تا دانشجو که می دونستن استادشون چیزی نمی دونه بنابراین هر چی دوست داشتن نوشتن Amaze
ولی اگه حال اینگلیسی دارین من help نرم افزار Matlab رو پیش نهاد من کنم
نقل قول: راست ميگم اين Babylon همشو با OCR در مياره
من بعید می دونم حتی اگه با یه فایل به همین اسم هم سروکار داشته باشه ولی شما هم توی Pain چند تا کلمه بنویس و چند بار با Babylon امتحانش کن ببین چقدر خطا داره ولی رو یه فایل TXT نه
راستی این Babylon من البته ورژن 5 یه کم اذیت میکنه یه license داشتم که تموم شد کرکش هم اگه به اینترنت وصل بشه قاطی می کنه فایر وال XP هم که کشکه خیلی راحت ازش رد می شه شما با چی کار می کنین
به نظر من حق با هادي خان هست وقتي ميتونه با چند تا آي پي آي متن رو بدست ياره مگه بيكاره بره اونو با OCR بخونه؟! :roll:
اولا بحث خيلي توپيه و مفيد.
دوم در هر صورت اين بيبيلون نوشته گرافيكي رو هم ميخونه و تشخيص ميده يعني به احتمال زياد از او سي آر استفاده ميكنه . اما ابعاد متن رو تو صفحه تشخيص دادن خودش هنريه .
اما اين احتمال هم هست كه با تشخيص محيط بجاي او سي آرOCR از API استفاده كنه.
خب مثل اين كه بحث داره خيلي خيلي جالب ميشه .
ولي يه سوال اين Babylon هر نوع متني با هر نوع فونتي رو شناسايي مي كنه حتي خودم يه فونت كج و ماوج (البته انگليسي) ساختم ولي بازم Babylon متن رو تشخيص داد در اين صورت اگه بخواهد پيكسل به پيكسل رو مقايسه كند بايد ااين فونت رو نشناسه ! ولي شناخت !!!!!!!
البته من چيز زيادي از روش OCR نمي دانم ولي اگه بخواهد پيكسل به پيكسل مقايسه كنه بايد سر فونت هاي مختلف گير كنه !!!!!!!!!!!!
-------------------------------
البته عذر مي خواهم اگه چرت و پرت نوشتم دليلش هم اينه كه زياد با OCR آشنايي ندارم :oops: :oops: :oops: :oops:
من حوصل ام نكشيد همه متن ها رو بخوانم ولي نظرات همون هايي رو هم كه خوندم به نظرم (تاكيد مي كنم به نظر من چون ممكنه من هم اشتباه بگم) درست نبود
من فكر مي كنم روش كار با استفاده از چنگال هاست و نمي دونم چرا آقا وحيد تو عنوان كلمه اينجكت رو قيد كرده
و لي اون چيزي رو كه ميتونم بگم مطمىن هستم اينه كه آخه OCR چه ربطي به فونت داره . babylon از OCR وقتي استفاده مي كنه كه شما روي يك تصوير كليك كنيد نه متن . ضمنا فونت شما هر چه كج و معوج باشه كد داره واز كداش تشخيص داده مي شه نه از تصويرش :wink:
صفحه‌ها: 1 2 3