مطالب توسط

بررسی تغییرات حوزه کیفیت داده با استفاده از تحلیل کلمات کلیدی

 حوزه کیفیت داده ازجمله حوزه های رو به رشد و مهم در حوزه سیستم های اطلاعاتی است. شناخت دقیق این حوزه از یکسو و شناخت ویژگی های زیر حوزه های نوین این حوزه برای محققان از اهمیت بالایی برخوردار خواهد بود. شناخت ویژگی این حوزه و میزان بین رشتهای بودن آنها به محققان برای تصمیم گیری در مورد روند تحقیقات و انتخاب حوزه فعالیت کمک بسزایی خواهد کرد. برای شناسایی حوزه ها و بررسی میزان بین رشتهای بودن آنها، در این مطالعه با استفاده از گراف هم رخدادی کلمات و تحلیل 9000 مقاله، ویژگی های حوزه های نوین مطالعاتی مورد بررسی قرارگرفته است. بر اساس این مطالعه مشخص شده است که این حوزه ها بیشتر بین رشتهای بوده است و تمرکز آن بر روی ارتباط بین چندین حوزه مطالعاتی است. به بیان دیگر این کلمات کلیدی بیشتر با کلمات کلیدی موجود در خوشه های دیگر ارتباط داشته اند تا با کلمات کلیدی که با آنها در یک خوشه قرارگرفته است. بر اساس این مطالعه جدیدترین حوزه مرتبط با کلان داده است که مباحث کپارچه سازی و داده گمشده در این حوزه از اولویت بالاتری نسبت به مابقی حوزه ها برخوردار است.

دانشمند داده ها

گسترش استفاده از فناوری اطلاعات در بخش های مختلف کسب و کار، باعث افزایش منابع ارزشمندی به نام داده شده است. هر چند در گذشته نیز سازمان ها این منابع را در اختیار داشتند، اما حجم ، تنوع و سرعت تولید این داده ها به مراتب کمتر بوده است. با رشد تکنولوژی های Big Data نقش جدیدی در شرکت های بزرگ به نام دانشمند داده(Data Scientist) ایجاد شده است که در حقیقت نسخه ی جدیدی از نقش “تحلیلگر داده” یا “تحلیلگر کسب و کار” می باشد. چیزی که این نقش را با نقش های ذکر شده متفاوت می سازد، دانش و تیزهوشی تجاری برای گرفتن تصمیمات سخت و سریع و انتقال آنها به هر دو بخش روسای شرکت و رهبران ITاست تا بتوانند بهترین راه را برای غلبه بر یک چالش سازمانی بیابند. در حقیقت دانشمند داده با دسترسی به حجم زیادی داده، حس کنجکاوی و زیر سوال بردن پیش فرض های فکری سعی می کند تا مواردی را بیابد که برای سازمان مزیت رقابتی ایجاد کند. به طور خلاصه می توان گفت یک دانشمند داده شخصی است دارای طلاعات کافی از هر دو رشته ی مهندسی کامپیوتر و آمار. البته در مورد مهارت های مورد نیاز برای یک مهندس داده در ادامه توضیح خواهم داد.علم داده به عنوان علمی کاملا کاربردی می تواند پاسخی مناسب به این داده های عظیم تولید شده باشد. به منظور استفاده از این منابع ارزشمند، وجود نیروی ماهر بسیار ضروری است. متاسفانه اکثر صاحبان صنایع در دنیا از کمبود نیروی ماهر در این حوزه شکایت دارند. این نگرانی از سوی صنعت حاوی دو پیام بسیار مهم می باشد. اول اینکه صاحبان صنایع به اهمیت این علم پی برده اند و دوم اینکه فرصت های شغلی مناسبی برای افراد خوش فکر و با استعداد در این حوزه به وجود آمده است. آمارهای مختلف بین المللی نیز حاکی از رشد استخدام در این حوزه است. به عنوان مثال در تحقیق انجام شده در آمریکا، فرصت شغلی علم داده در سال 2015 نسبت به سال 2014 با رشد 57 درصدی همراه بوده است.

چت بات چیست؟

آینده‌ی ما با چت‌بات‌ها (Chat Bot) گره خورده؛ چه برایش آماده باشیم یا نه. این عبارتی است که به‌طور مستقیم یا تلویحی، از زبان رهبران شرکت‌های بزرگ تکنولوژی می‌شنویم. آن‌ها در پی ساخت پلتفرم‌هایی هستند که قادرند جای اپلیکیشن‌های امروزی‌مان را بگیرند؛ بات‌های (‌Bot) کوچک هوشمندی را در نظر بگیرید که به کلمات‌تان گوش می‌دهند و به شما در انجام کارها کمک می‌کنند. ساتیا نادلا، مدیر عامل مایکروسافت اخیرا گفته «این تکنولوژی‌ای است که از آن راه گریزی نیست.» فیسبوک هم Bot Store خود را راه انداخته است. اما می‌خواهیم بک بار دیگر ببینیم بات‌ها چه هستند، به چه دردی می‌خورند و از همه مهم‌تر شرکت‌های بزرگ در توسعه‌ی آن‌ها در چه مرحله‌ای قرار دارند.

راهکارهای تضمین درآمد

شايد به جرات بتوان گفت که نظارت و تحلیل منظم روزانه یا هفتگی روند تغییرات منحنی های درآمدی، یکی از رایج ترین کنترل های تضمین درآمد برای شناسایی نشتی درآمد و تضمین درآمد در سازمانها می باشد.

شناسایی و به تبع آن استفاده حداکثری از ظرفیت و توانمندیهای واحد تضمین درآمد و بررسی تقلبات، یکی از اصلی ترین دغدغه هایی است که ابزارهای تضمین درآمد و بررسی تقلبات در سازمانها با آن روبرو هستند.یکی از دلایل مهم عدم اقبال از یک ابزار تضمین درآمد و بررسی تقلبات، عدم کسب حمایت قابل توجه از سوی مدیران ارشد سازمانها و سنجش اثرات کمی آن بر کسب و کار دانست (به ویژه در مواقعی که از تکنیک های پیشگیرانه استفاده می گردد)؛ از این رو، مدیران ارشد سازمانها قادر به تشخیص و شناسایی میزان درآمدی که از نشتی آن توسط یک ابزار تضمین درآمد بعمل خواهد آمد نمی باشند.

یکی از تکنیک های رایج و ابزارهای تضمین درآمد در دنیا استفاده از داده کاوی برای کاهش نشتی درآمد و بررسی فرصت های از دست رفته افزایش درآمد در سازمان است. مثلاً در صنعت مخابرات؛ حذف تقلب در ارائه حق اشتراک با تکنیک های داده کاوی می تواند منجر به کشف نشتی و تضمین درآمد در آن صنعت گردد.

یکی از روش های تقلب که می تواند در فرآیند ثبت و تامین سفارش اتفاق بیفتد، تقلب در ارائه حق اشتراک به مشتریان و شرکای تجاری نظیر شرکای اتصال متقابل، رومینگ، خدمات ارزش افزوده و عمده فروشی می باشد. چنانچه به موارد یاد شده، دسترسی استفاده و مصرف از شبکه اپراتور، بدون داشتن مجوزهای لازم مانند قرارداد، تسویه حساب مالی و … داده شود، مسلماً اپراتور مذکور از نظر درآمدی در ریسک عدم وصول مطالبات قرار خواهد گرفت.

بازشناسی گفتار احساسی و شناسایی حالت گفتار در زبان فارسی

حالت گفتار سبب افزودن اطلاعات اضافی  نسبت به اطلاعات نوشتاری  می شود. از طرف دیگـر، وجود حالت در گفتار سبب بروز مشكل در فرایند بازشناسی  گفتار می شود. در تحقیقات قبلی  نشان داده شد كه حالت گفتار سبب تغییرات اساسی  در پارامترهای  گفتاری  می شود.برای  بهبود نتایج بازشناسی گفتار با حالت، ابتـدا باید تـأثیر آن را بـر پارامترهـای  گفتـاری  به دست آورد و در مرحلة بعدی، از پارامترهای  مناسبی  برای  بهبود نتایج بازشناسی  استفاده كرد.در این تحقیق با توجه به نتایج به دست آمده در زمینة تأثیر حالت های  گفتاری  خـشم و انـدوه بـر پارامترهای  گفتاری  نظیر فرم نت ها و فركانس گام در زبان فارسی، بهبود نتایج بازشناسـی گفتـار با حالت، با مدلهای عادی مد نظر است. با توجه به تغییرات منظم پارامترهـایی  نظیر فركـانس گام، فرم نت ها و شیب آنها با حالت گفتار، این پارامترهـا بـه بـردار ویژگـی  سیستم بازشناسـی  ضافه می شوند. این كار سبب بهبود نتایج بازشناسی می شود. میزان این بهبـود بـستگی بـه نـوع پارامتر، تعداد مخلوط ها و حالت گفتـار دارد. بـا توجـه بـه اهمیت شناسـایی حالـت گفتـار و همچنین نقش آن در بهبود كیفیت سیستم بازشناسی گفتار، با استفاده از فرم نت ها و فركانس گام به عنوان ویژگی های  ورودی  و به كارگیری  روش های  درخت تصمیم گیری  و GMM ، كار شناسای ی  حالت گفتار نیز انجام شده است.

استخراج ویژگی های مقاوم گفتاری زیر باندی با استفاده از شبکه های

شبکه های عصبی در هم پیچش (CNN ) به عنوان گروهی از شبکه های عصبی عمیق، در سالهای اخیر کاربرد فراوانی در مدلس ازی آکوستیک و همچنین استخراج ویژگی و مدل سازی توأم در بازشناسی گفتار یافته اند. در مقاله حاضر، پیشنهاد میشود تا از CNN برای استخراج ویژگی مقاوم به نویز استفاده شود، درحالیکه ورودی CNN طیف سیگنال گفتار نویزی و خروجی هدف آن خروجی های متناظر تمیز از بانک فیلتر مل است. به این ترتیب CNN ویژگی های مقاوم به نویز را از طیف سیگنال گفتار استخراج می نماید. نقطه ضعف CNN در این روش آن است که تنها یک وضوح فرکانسی ثابت را به کار می گیرد. از این جهت، در این مقاله استفاده از چند شبکه عصبی درهم پیچش با اندازه های فیلتر د رهم پیچش متفاوت، جهت مدل سازی تفاوت وضوح فرکانسی برای استخراج ویژگی از طیف سیگنال گفتار پیشنهاد می شود. روش پیشنهادی را شبکه عصبی درهم پیچش چند دقتی (MRCNN) نامگذاری کرده ایم. آزمایشها روی دادگان Aurora2 نشان میدهند که CNN نسبت به شبکه باور عمیق در استخراج ویژگی مقاوم به نویز میانگین دقت بازشناسی را 20 درصد بهبود می دهد. همچنین نتایج نشان میدهند که MRCNN میانگین دقت بازشناسی را نسبت به شبکه عصبی درهم پیچش استاندارد (تک دقتی) 1 درصد بهبود می دهد

بررسی تاثیر اینترنت اشیا بر عملکرد سازمانی با در نظر گرفتن نقش واسطه ای خلق دانش

هدف: هدف از پژوهش تأثیر اینترنت اشیا بر عملکرد سازمان با در نظر گرفتن نقش خلق دانش بود.
روش پژوهش: پژوهش، از نظر هدف کاربردی و به روش توصیفی- همبستگی است. جامعـه آمـاری بانـک مهر اقتصاد استان تهران مشتمل بر 1050 نفر است و تعداد نمونه 284 نفر با روش تصادفی ساده در دسترس انتخاب شـد و با استفاده از پرسشنامه موردسنجش قرار گرفت.

یافته ها: یافته های پرسشنامه از طریق آلفای کرون باخ و روایی صـوری مـورد دسـنجش قـرار گرفـت و بـه ترتیب پایایی و روایی آن تائید شد. همچنین، داده های مدل معادلات ساختاری نشان دهنده برازش خوب مدل است.
نتیجه گیری: نتایج نشان میدهد بانک مهر اقتصاد با به کارگیری اینترنت اشیاء منجر به افزایش عملکـرد شـده
است. همچنین خلق دانش بر رابطه میان اینترنت اشیاء و عملکرد تأثیر مثبت و معناداری می گذارد.

پردازش زبان طبیعی و بازیابی اطلاعات موسیقایی

هدف این مقاله بررسی کارکردهای پردازش زبان طبیعی در بازیابی اطلاعات موسیقایی است. پژوهش ها در حوزه موسیقی محاسباتی نشان می دهد که حوزه پردازش زبان طبیعی به پژوهش های جدید صورت گرفته در موسیقی نزدیک است . بنابراین می توان از این شباهت سود جست و تکنیک های پردازش زبان طبیعی را در موسیقی به کار بست. در این مقاله شباهت میان هر دو حوزه فوق توصیف می شود. همچنین سطوح پردازش زبان طبیعی و کارکرد موسیقی محاسباتی تبیین می گردد و در ادامه به نقاط مشترک پژوهش های بازیابی اطلاعات موسیقایی و حوزه پردازش زبیان طبیعی اشاره می شود. در پایان، پژوهش های انجام شده درباره مدل سازی موسیقی آماری با نظریان مشابه در حوزه پردازش زبان طبیعی مقایسه و رهنمون هایی برای بازیابی اطلاعات موسیقایی ارائه می گردد

بررسی مشکلات جستجو و بازیابی تصاویر در موتورهای کاوش برگزیده مبتنی بر ویژگیهای نگارشی زبان فارسی

هدف: پژوهش حاضر با هدف تعیین مشکلات جستجو و بازیابی تصاویر در موتورهای کاوش برگزیده مبتنی بر ویژگیهای  نگارشی زبان فارسی انجام شد.

روش: این پژوهش از نوع کاربردی است و برای پاسخگویی به سؤالات پژوهش از روش ارزیابی با مشاهده مستقیم استفاده شد. جامعه آماری پژوهش شامل سه موتور کاوش گوگل، یاهو و بینگ است. برای گردآوری دادهها، از سیاهه محقق ساخته استفاده شد و تجزیه و تحلیل دادهها در دو سطح آمار توصیفی و استنباطی صورت گرفت.
یافته ها: نتایج پژوهش نشان داد که موتورهای کاوش گوگل، بینگ و یاهو بسیاری از ویژگی های نوشتاری و معنایی زبان فارسی را در هنگام جستجو و بازیابی تصاویر نادیده می گیرند. همچنین مشکلات مربوط به نگارش واژگان مشتق، مشتق- مرکب، انواع جمعهای فارسی و مکسر عربی، همزه بدون کرسی و استفاده از زبان محاوره در بخش نوشتاری؛ و چند معنایی در بخش معنایی از مشکلات عمده زبان فارسی در جستجو و بازیابی تصاویر از این موتورهای کاوش به شمار میآیند. به علاوه، در بخش معنایی و نوشتاری، قابلیت های گوگل در انطباق با زبان فارسی نسبت به همتایانش بیشتر است.

تشخیص هویت با استفاده از ویژگیهای محلی و ساختاری رگ های شبکیه چشم

سیستم تشخیص هویت بر اساس شبکیه چشم یک سیستم بیومتریک پایدار و قابل اعتماد است که اشکالاتی مانند فراموشی، لـو رفـتن، گم شدن و جعل شدن را ندارد. در این مقاله یک روش جدید با دقت عملکرد بالا ارائه می گـردد کـه بـرخلاف سـایر روش هـای مبتنـی بـر شبکیه در مقابل چرخش و جابجایی عروق مقاوم است. این سیستم شـامل سـه مرحلـه اصـلی پـیش پـردازش، اسـتخراج ویژگـی و تطبیـق ویژگی می باشد. استخراج عروق با روش تبدیل موجک پیوسته مختلط انجام می شود. در مرحله اسـتخراج ویژگـی بـا اسـتفاده از عملگـر تشخیص الگوی محلی رگ علاوه بر تشخیص نقاط ویژه انشعاب و تقاطع در شبکه عروق، ویژگـی هـای ایـن نقـاط ماننـد تعـداد شـاخه، کوچکترین زاویه و نوع نقاط (انشعاب و تقاطع) استخراج می گردد. در مرحله تطبیق ویژگی، از تعداد نقاط ویـژه منطبـق در کنـار میـزان شباهت توپولوژیگراف حاصل از اتصال نقاط ویژه تصویر ورودی و تصاویر مرجع استفاده شده و در نهایت هویت فرد احراز می گـرددروش ارائه شـده روی پایگـاه داده هـای DIARET ،VARIA ،DRIVEو STARE اجـرا شـده انـد کـه دقـت تشـخیص هویـت در ایـن پایگاه های داده به ترتیب100% 81/99%  ،7/99%،100% بوده است