دادهکاوی به معنای کشف دانش و استخراج آن از مقادیر زیادی از دادههای خام است. از آنجا که تنها ابزار مفید برای استفاده از تحلیل وقایع گذشته در پایگاه دادهها به منظور پیشبینی در آینده، دادهکاوی خواهد بود. از این رو برای کشف و استخراج اطلاعات از آمار مد نظر برنامهریزان و مدیران هر سازمانی، نیازمند دادهکاوی خواهیم بود. از سوی دیگر عصر حاضر، عصر روشهای نوین و متنوع تولید، ذخیره و گردآوری دادهها و اطلاعات آماری است. سیاستگذاران با حجم انبوهی از اطلاعات آماری متنوع که در کسری از زمان بیشتر و بیشتر تولید میشوند در سازمانهای مهم و کلیدی کشور مواجه هستند. دادهکاوی اسلوبی برای یافتن دانش و اطلاعات بهینه از میان این انبوه ریزدادهها است. دسترسی به الگوهای مخفی دادهها و اطلاعات آماری انباشت شده توسط سازمانها حاکی از آن است که دادهکاوی بسیار ارزشمند و گرانبهاست.
کتاب حاضر حاوی مفاهیم و روشهای اساسی دادهکاوی است و در ۵ فصل تنظیم شده است. در انتهای هر فصل پس از بیان خلاصه به توضیح منابع و مراجع برای مطالعهی بیشتر نیز پرداخته خواهد شد. فصل اول به مقدمهای در مورد مفاهیم دادهکاوی میباشد. این فصل مشتمل بر چشمانداز و ماموریت کتاب برای آشنایی با سایر مطالب کتاب خواهد بود. فصل دوم و سوم به مفاهیم دادهکاوی و آمادهسازی (پاکسازی و تمیزسازی) دادهها اختصاص دارد. در فصل چهارم به پردازشهای برخط، انبار دادهها و پایگاه داده پرداختهخواهد شد. در فصل پنجم روشهای دادهکاوی شامل درخت تصمیم، خوشهبندی، ردهبندی، قواعد پیوند و سایر الگوریتمهای دادهکاوی مورد مطالعه قرار میگیرد. فصل آخر نیز به برخی از موضوعات مرتبط با دادهکاوی پرداخته خواهد شد.