اصطلاح «دادهکاوی» به مجموعهی روشهای استخراج خودکار دانش مفید از مخازن حجیم دادهها اطلاق میشود. در سالهای اخیر، با توجه به افزایش شدید حجم مخازن دادهها، گرایش زیادی به استفاده از فنون دادهکاوی در صنعت اطلاعرسانی پدید آمده است. مرکز آمار ایران نیز بهعنوان متولی اصلی آمار کشور، امروزه با حجم گستردهای از دادهها مواجه است که استخراج دانش مفید از آنها با روشهای ساده و سنتی، میسر نیست. یکی از مهمترین طرحهای آمارگیری این مرکز که هر سال اجرا و منجر به ایجاد دادگان حجیمی میشود، طرح آمارگیری از هزینه و درامد خانوارهای شهری و روستایی است. دادگان حاصل از اجرای سالانهی این طرح، اطلاعات متنوعی در مورد خانوارهای شهری و روستایی ایرانی را در بر دارد، که اعمال الگوریتمهای دادهکاوی بر روی آن میتواند منجر به تولید اطلاعات مفیدی در مورد هزینه و درامد خانوارها شود و برای اتخاذ تصمیمهای مناسب از سوی مدیران ارشد دستگاههای اجرایی و سیاستگذاران، مورد استفاده قرار گیرد. در این طرح پژوهشی، الگوریتمهای متفاوت دادهکاوی، از جمله خوشهبندی و طبقهبندی و استخراج قواعد پیوند، بر روی دادگان طرح آمارگیری از هزینه و درامد خانوارها در سالهای ۱۳۸۰ تا ۱۳۸۵، اعمال شده است.