تبلیغات اینترنتیclose
داده کاوی (Data Mining) چیست ؟
 
وبلاگ تفریحی همه چی از همه جا

مديريت ذخيره سازی و دستيابی اطلاعات

داده هایاطلاعاتی(Data) به عنوان يکی از منابع حياتی سازمان شناخته می شود و بسياریاز سازمان ها با اطلاعات و دانش سازمانی خود مانند ساير دارايی های ارزشمندشانبرخورد می کنند.

 نکته: داده اطلاعاتی (Data) به اطلاعات خامسازمان اتلاق می‌شود و اطلاعات (Information) به داده‌های پردازش شده. همچنين داده های پردازش شده پس از طبقه بندی و آناليز به دانش سازمان (Knowledge) تبديل می گردند.

حال تصور نماييد، دسترسی به اطلاعات (Information) در شرايطی کهداده‌ها به روش نامناسبی نگهداری شوند و يا روش ضابطه مندی جهت دستيابی به آنهاوجود نداشته باشد تا چه حد مشکل است . برای رسيدن به يک سيستم اطلاعاتی مناسب،داده‌ها می بايست به صورتی منطقی طبقه بندی و ذخيره شوند تا استفاده از آن هاساده‌تر بوده، با کارايی بيشتری تحليل شوند و سريعتر مورد استفاده قرار گيرند و درنتيجه مديريت بهتری بر آن ها اعمال شود. در اين راستا مجموعه خدمات زير در زمينهمديريت بانک های اطلاعاتی توسط اين شرکت ارايه می‌شود :

ساختار بانکاطلاعاتی سازمان:
داده های سازمان ها در انواع بانک های اطلاعاتی و باساختارهای متنوعی ذخيره می‌گردند . طراحی و سازماندهی اين ساختارها، بکارگيری وانتقال به بانک‌های اطلاعاتی پيشرفته و بهينه سازی آن ها يکی خدماتی است که توسطدرسا رسانه هوشمندارايه می شود .

 

داده کاوی (Data Mining):

کاوش‌های ماشینی در داده‌ها یا داده‌کاوی (Data mining) را باید یکی از سامانه‌های هوشمند (Intelligent systems) دانست. سامانه‌های هوشمند زیر شاخه‌ایست بزرگ و پر‌کاربرد از یادگیری ماشینی که خود زمینه‌ای‌ست در هوش مصنوعی. زمینه علمی جدید و پهناور یادگیری ماشینی (که "کاوش‌های ماشینی در داده‌ها" بخشی ست بزرگ از زیر شاخه سامانه‌های هوشمند آن ست)، به واقع همان امتداد و استمرار دانش کهن و همه جا گیر آمار است در جهت ماشینی کردن یادگیری، تعلّم، و سرانجام، دانش.

داده کاوی به عنوان مهمترين کاربرد Data Warehouse یاانباره های داده شناخته می شود . به وسيله داده کاوی داده های موجود مورد تحليلقرار می گيرند تا روندهای احتمالی، ارتباط‌هاي غير محسوس و الگو های مخفی داده هااز بين انبوه داده ها، شناسايی شوند .

در اين فرايند از الگوريتم های پيچيدهرياضی و آماری استفاده می شود تا داده ها تبديل به دانش سازمان شوند.


امروزه با حجم عظيمي از داده ها روبرو هستيم. براي استفاده از آنها به ابزارهاي كشف دانش نياز داريم. داده كاوي به عنوان يك توانايي پيشرفته در تحليل داده و كشف دانش مورد استفاده قرار مي گيرد. داده كاوي در علوم (ستاره شناسي،...)‌در تجارت (تبليغات، مديريت ارتباط با مشتري،...) در وب (موتورهاي جستجو،...) در مسايل دولتي (فعاليتهاي ضد تروريستي،...) كاربرد دارد. عبارت داده كاوي شباهت به استخراج زغال سنگ و طلا دارد. داده كاوي نيز اطلاعات را كه در انبارهاي داده مدفون شده است، استخراج مي كند.

 

*************************

در واقع هـــــدف از داده كاوي ايجاد مدل هايي براي تصميم گيري است. اين مدلها رفتارهاي آينده را براساس تحليلهاي گذشته پيش بيني مي كنند. به كاربردن داده كاوي به عنوان اهرمي براي آماده سازي داده ها و تكميل قابليتهاي انباره داده (DATA WAREHOUSE) ، بهترين موقعيت را براي به دست آوردن برتريهاي رقابتي ايجاد مي كند.

سيستم هاي بانك داده (DATABASE) ، نقشي كليدي در سيستم هاي مديريت و انبار داده، بازي مي كنند. يك سيستم بانك داده، شامل فايل هاي بانك داده و سيستم هاي مديريت بانك داده است.

اغلب تجارت ها به تصميم گيريهاي استراتژيك و يا اتخاذ خط مشي هاي جديد براي خدمت رساني بهتر به مشتريان نياز دارند. به عنوان مثال فروشگاهها آرايش مغازه خود را براي ايجاد ميل بيشتر به خريد مجدداً طراحي مي كنند و يا خطوط هواپيمايي تسهيلات خاصي را براي مشتريان جهت پروازهاي مكرر آنها در نظر مي گيرند. اين دو مثال به داده هايي در مورد رفتار مصرفي گذشته مشتريان براي تعيين الگوهايي به وسيله داده كاوي، نياز دارد. براساس اين الگوها تصميمـــات لازم اتخاذ مي شود. در واقع ابزار داده كــــاوي، داده را مي گيرد و يك تصوير از واقعيت به شكل مدل مي سازد، اين مدل روابط موجود در داده ها را شرح مي دهد.

از نظر فرايندي فعاليتهاي داده كاوي به سه طبقه بندي عمومي تقسيم مي شوند:
اكتشاف : فرايند جستجو در يك بانك داده براي يافتن الگوهاي پنهان، بدون داشتن يك فرضيه از پيش تعيين شده درباره اينكه اين الگو ممكن است چه باشد.
مانند تحليلهايي كه برحسب كالاهاي خريداري شده صورت مي گيرد، اينگونه تحليلهاي سبدي نشانگر موارديست كه مشتري تمايل به خريد آنها دارند. اين اطلاعات مي تواند به بهبود موجودي، استراتژي طراحي، آرايش فروشگاه و تبليغات منجر گردد.

مدل پيش بيني : فرايندي كه الگوهاي كشف شــده از بانك داده را مي گيرد و آنها را براي پيش بيني آينده به كار مي برد.

مانند پيش بيني فروش در خرده فروشي، الگوهاي كشف شده براي فروش به آنها كمك مي كند تا تصميماتي را در رابطه با موجودي اتخاذ كنند.

تحليلهاي دادگاهي : به فرايند به كارگيري الگوهاي استخراج شده براي يافتن عوامــل داده اي نامعقول و متناقض مربوط مي شود.
مانند شناسايي و تشخيص كلاهبرداري در موسسات مالي. كلاهبرداري به ميزان زيادي پرهزينه و زيان آور است، بانكها مي توانند با تحليل دادوستدهاي جعلي گذشته الگوهايي را براي تشخيص و كشف كلاهبرداري به دست آورند.

 از نمایی دیگر، داده كاوي ، بعنوان روشي در استخراج دانش از متون، يكي از موضوعات مهم در گستره اي از اعمال مديريت اطلاعات است. در اين ميان آنچه از اهميت فوق العاده اي برخوردار است ارايه راه‌كارهايي براي مواجه با اين حجم عظيم اطلاعاتي و استفاده بهينه از اطلاعات در جهت خلق دانش، توليد سينرجي و در نهايت افزايش خرد جمعي است.
در سالهاي اخير اهميت متون به عنوان منابع با پتانسيل اطلاعاتي بسيار بالا به نحو گسترده‌اي مورد توجه قرار گرفته به طوري كه كشف دانش از متون به عنوان يكي از مهمترين فعاليتهاي محققين حوزه هوش مصنوعي و فناوري اطلاعات قرار گرفته است. تحقيقات بسياري صورت گرفته اما محدوده فعاليت بقدري گسترده است كه نيازمند توجه بيشتري مي‌باشد.
امروزه محققان به اين مسئله معترفند كه با وجود انجام تحقيقات بي وقفه در زمينه كاري خود، نمي‌توانند همزمان با پيشرفت دانش، معلومات خود را به روز نگاه دارند. بعنوان مثال بانك اطلاعاتي
Medline در حال حاضر حاوي 10 ميليون چكيده مقاله است و هر هفته بين هفت تا هشت هزار چكيده مقاله به اين بانك اطلاعاتي افزوده مي‌شود. در اين بين شايد همه مقالات مربوط به يك دانش خاص نباشند، اما تعداد مقالات تخصصي كه در حوزه تحقيق يك دانش خاص قرار مي‌گيرد به اندازه اي است كه يك نفر نمي‌تواند ادعا كند همه آنها را مطالعه كرده است بعلاوه نقش مطالعات عميق و گسترده و استخراج ايده ها و دانش جديد از مطالب مطالعه شده بر كسي پوشيده نيست.
در اين ميان اينترنت بعنوان بزرگترين منبع اطلاعاتي همگاني، تشكيل يافته از صد ها ميليون صفحه اطلاعات است كه به جهت همگاني بودن آن و نبود آينده‌نگري كافي در زمان تشكيل و رشد آن ، متحمل نگاهداري اطلاعات نويسندگان، محققان ، انديشمندان و غيره به همان نحوي كه آنها مي نوشتند گرديد. نبود يك استاندارد همه جانبه و دقيق در تنظيم متون و قرار گيري اين مجموعه عظيم بصورتي غير ساختيافته و يا بعضاً نيمه ساختيافته، جامعه اطلاعاتي را دچار نوعي سردر گمي و مشكل در دستيابي به اطلاعات مورد نياز كرده بطوري‌كه براي يافتن مطالب مورد نظر خود متحمل هزينه هاي زماني بسياري مي‌گردند. محققان به ارايه راه كارهايي براي ساخت يافته كردن اطلاعات نمودند و با ارايه زبانهاي نشانه گذاري استاندارد نظير
XML تا حد زيادي جلوي اين از هم پاشيدگي اطلاعاتي را گرفتند اما آنچه همچنان باقي است وجود بسياري از متون غير ساخت‌يافته مي‌باشد؛ در همين راستا ارايه ابزاهايي كه با بررسي متون بتوانند تحليلي روي آنها انجام دهند منجر به شكل گيري زمينه‌اي جديد در هوش مصنوعي و فناوري اطلاعات گرديده كه به يادگيري متن معروف است.
اين حوزه تمام فعاليتهايي كه به نوعي به دنبال كسب دانش از متن هستند را شامل مي‌گردد. آناليز داده هاي متني توسط تكنيكهاي يادگيري ماشين، بازيابي اطلاعات هوشمند، پردازش زبان طبيعي يا روشهاي مرتبط ديگر همگي در زمره مقوله يادگيري متن قرار مي‌گيرند. يكي از روشهايي كه ذكر گرديد، استفاده از تكنيكهاي يادگيري ماشين در زمينه پردازش متن است، مسئله قابل تامل اين است كه اين تكنيكها در ابتدا در مورد داده هاي ساخت‌يافته به كار گرفته شدند و علمي به نام داده كاوي را بوجود آوردند. داده هاي ساخت‌يافته به داده هايي اطلاق مي‌گردد كه بطور كاملاً مستقل از همديگر ولي يكسان از لحاظ ساختاري در يك محل گردآوري شده اند. انواع بانكهاي اطلاعاتي را مي‌توان نمونه هايي از اين دسته اطلاعات نام برد. در اينصورت مسئله داده كاوي عبارت از كسب اطلاعات و دانش از اين مجموعه ساخت يافته. اما در مورد متون كه عمدتاً غير ساخت يافته يا نيمه ساخت يافته هستند ابتدا بايد توسط روشهايي ، آنها را ساختارمند نمود و سپس از اين روشها براي استخراج اطلاعات و دانش از آنها استفاده كرد. به هر حال استفاده از داده كاوي در مورد متن خود شاخه اي ديگر را در علوم هوش مصنوعي بوجود آورد به نام متن كاوي . از جمله فعاليتهاي بسيار مهم در اين زمينه، طبقه بندي (دسته بندي) متن مي‌باشد.
طبقه بندي متن، يعني انتساب اسناد متني بر اساس محتوي به يك يا چند طبقه از قبل تعيين شده، يكي از مهمترين مسايل در متن كاوي است؛ مرتب كردن بلادرنگ نامه هاي الكترونيكي يا فايلها در سلسله مراتبي از پوشه ها، تشخيص موضوع متن، جستجوي ساختيافته و/ يا پيدا كردن اسنادي كه در راستاي علايق كاربر ميباشد، از جمله كاربردهاي مبحث طبقه بندي (دسته بندي-كلاسه بندي ) متن است. در بسياري از موارد ، افراد حرفه اي آموزش ديده، براي طبقه بندي متون جديد به كار گرفته مي‌شوند. اين فرآيند بسيار زمان بر و پر هزينه است و لذا كاربرد خود را محدود مي‌سازد، به همين منظور علاقه روزافزوني به توسعه فناوري هايي در دسته بندي خودكار متن ابراز ميشود.
در هر حال در جوامع اطلاعاتي امروزي آنچه از اهميت روزافزوني برخوردار است، اطلاعات و تبادل آن است و در اين راستا به توسعه فناوري هاي مرتبط پرداخته مي‌شود، اما يك مرحله كاملاٌ جديد تر و كاملاً مورد توجه جوامع فرا صنعتي، خلق دانش جديد از اطلاعات قبلي است كه اين جوامع آنرا كليد موفقيت خود در آينده دانسته و به سختي در اين زمينه فعاليت مي‌نمايند. بر ما است تا ضمن ارتقاي فناوري اطلاعات در كشور و ايجاد زير ساختهاي لازمه در اسرع وقت، به اينگونه مسائل جدي‌تر كه در زمره
Information High Technology قرار مي‌گيرند، بپردازيم.
صفحه قبل صفحه بعد
نظر شما
نام : *
پست الکترونیک :
وب سایت/بلاگ :
*
:) :( ;) :D
;)) :X :? :P
:* =(( :O @};-
:B /:) =D> :S
کد امنیتی : *


نوع مطلب : فناوری اطلاعات, | بازدید : 2487
برچسب ها : داده کاوی (Data Mining) چیست ؟,
جمعه 7 تير 1392 :: نويسنده : A G    


درباره وبلاگ

سلام این وبلاگ جهت سرگرم کردن هرچند اندک شما بازدید کننده گرامی طراحی شده است. امید است با یاری شما دوستان و ارسال انتقادات یا پیشنهادات خود ما را در این راه یاری کنید درصورتی که عضو وبلاگ "کنج" شوید مطالب به پست الکترونیکی تان ارسال می شود
آمار کاربران
نام کاربری :
رمز عبور :
ثبت نام عضو جدید
فراموشي رمز عبور

تعداد اعضای آنلاین : 0
اعضای جدید امروز : 1
اعضای جدید دیروز : 0
تعداد کل اعضا : 24
اعضای آنلاین:

مطالب پربازدید
عکسهای خطای دید بازدید: 1139
نظرسنجی
نظر شما در باره این وبلاگ

خبرنامه
جستجو
آمار وبلاگ
آنلاین : 1
بازدید امروز : 16
بازدید دیروز : 3
بازدید هفته گذشته : 28
بازدید ماه گذشته : 158
بازدید سال گذشته : 6213
کل بازدید : 141848
کل مطالب : 126
نظرات : 145
رنک گوگل :