مقدمه:
گذران وقت در فضای مجازی و اینترنت یکی از موضوعهای مهمی است که امروزه در زندگی بشر جا باز کرده است و بسیاری از افراد وقت زیادی از زندگی روزمره خود را صرف فعالیت در فضای مجازی و اینترنت میکنند. بطوریکه بسیاری از افراد برای رفع بسیاری از نیازهای خود به اینترنت و فضای مجازی رو میآورند. حال ممکن است این فعالیتها منجر به اتلاف وقت و یا صرفهجویی در وقت فرد شود. فعالیتهایی مانند خرید، آموزش، سرگرمی، دستیابی به اطلاعات عمومی، تماشا کردن برنامهها یا گوش کردن به موسیقی، جستجو در شبکههای اجتماعی، دانلود و آپلود کردن اطلاعات، چک کردن ایمیل و ... میتواند فرد را ترغیب به استفاده از رایانه و اینترنت کند. ویژگیهای جمعیتشناختی افراد مانند سن، جنسیت، تحصیلات، وضعیت تأهل، شغل، شهری یا روستایی بودن، تعداد اعضای خانوار و ... میتوانند بر نوع استفاده افراد از اینترنت و فضای مجازی تأثیرگذار باشد. در واقع هدف این مطالعه شناسایی و بررسی عوامل مؤثر بر اینترنت و فضای مجازی و یافتن الگوهای استفاده از آن است؛ به این صورت که افراد با چه خصوصیات و ویژگیهایی چه نوع و چه مدت زمانی چه فعالیتهایی را دنبال میکنند. برای این منظور و دستیابی به این اهداف روشهای یادگیری ماشین مورد استفاده قرار گرفته است. به طور کلی میتوان گفت در طول تحقیق به سؤالات زیر پاسخ داده شده است:
- بیان مسئله و روششناسی
در مطالعه حاضر روشهای مختلف یادگیری ماشین از جمله روشهای ردهبندی و خوشهبندی مورد مطالعه قرارگرفتند و نهایتاً روشی که مناسب تحلیل و کشف الگوهای استفاده از اینترنت و فضای مجازی بود، مورد استفاده قرار گرفت. ازجمله روشهای ردهبندی که مورد مطالعه قرار گرفتند شامل درخت تصمیم، بیز ساده، رگرسیون لوجیت چندجملهای و ماشین بردار پشتیبان هستند، روشهای ردهبندی مناسب دادههایی است که دارای برچسب رده هستند و مدل بر مبنای دادههای آموزشی که دارای برچسب رده هستند ساخته میشود و در نهایت اگر مدل از دقت کافی برخوردار بود برای پیشبینی رده داده جدید مورد استفاده قرار میگیرد. از جمله روشهای خوشهبندی که مورد مطالعه گرفتند شامل k-میانگین، فازی، k-نماینده، k-میانه، k-مد و k-نمونه اولیه هستند. روشهای خوشهبندی مناسب دادههایی است که بدون برچسب هستند و به منظور کشف الگوهای پنهان موجود در دادهها مورد استفاده قرار میگیرند. استفاده از هر یک از این روشها بسته به نوع دادههایی که تحلیل میشوند، مورد استفاده قرار میگیرند. برای نمونه دادههایی که تنها شامل متغیرها یا ویژگیهای عددی هستند، روش k-میانگین، k-نماینده و k-میانه، برای دادههایی که شامل تنها متغیرهای رستهای هستند روش k-مد و برای دادههایی که شامل هر دو نوع متغیر عددی و رستهای هستند، k-نمونه اولیه مورد استفاده قرار میگیرند. از آنجایی که هدف در تحلیل دادههای اینترنت و فضای مجازی کشف الگوهای پنهان موجود در دادهها است و دادههای مورد مطالعه فاقد برچسب رده است برای این منظور مناسبترین روش، به کارگیری روشهای خوشهبندی است.
- نتایج
با اجرای خوشهبندی k -نمونه اولیه با تعداد خوشه 3 (تعداد خوشه با روش اعتبارسنجی متقابل حاصل شده است) روی دادههای گذران وقت و فضای مجازی استخراج شده از دادههای طرح گذران وقت مرکز آمار ایران برای سال 1399 الگوهای حاصل از نتایج خوشهبندی را به طور کلی میتوان به سه الگوی زیر بیان کرد (هر الگو بر اساس بیشترین درصدهای استفاده از اینترنت و فضای مجازی ساخته شده است برای نمونه با توجه به شکل1و2 در الگوی اول سطح تحصیلات فوق دیپلم و لیسانس و وضعیت اشتغال در حال تحصیل بیشترین درصد استفاده از اینترنت و فضای مجازی را دارد برای این منظور به عنوان ویژگیهای الگوی اول آورده شدهاند، سایر الگوها نیز به همین صورت ساخته شدهاند. لازم به ذکر است امکانات رفاهی شامل موارد خودرو شخصی، موتورسیکلت، دوچرخه، رادیو، تلویزیون، انواع ویدیو، انواع رایانه و تبلت، تلفن همراه، تلفن ثابت، یخچال، فریزر و ... هستند که بر اساس تعداد امکانات رفاهی در اختیار خانوار به سه رده کم، متوسط و زیاد تقسیم شد):
الگوی اول: جنس زن، میانگین گروه سنی 24.7، سطح تحصیلات فوق دیپلم و لیسانس، بدون همسر، در حال تحصیل، امکانات رفاهی کم، نوع مسکن غیرآپارتمانی و تعداد اعضای خانوار چهار و بیشتر.
الگوی دوم: جنس مرد، میانگین گروه سنی 28.82، سطح تحصیلات زیر دیپلم، بدون همسر، شاغل، امکانات رفاهی زیاد، نوع مسکن غیر آپارتمانی و تعداد اعضای خانوار سه.
الگوی سوم: جنس مرد، میانگین گروه سنی 40.63، سطح تحصیلات دیپلم و پیشدانشگاهی، دارای همسر، شاغل و امکانات رفاهی زیاد، نوع مسکن آپارتمانی و تعداد اعضای خانوار چهار و بیشتر.
با توجه به سه الگوی استفاده از اینترنت و فضای مجازی به دست آمده، نتایج زیر را میتوان استخراج نمود (در تحلیل نتایج در هر الگو یک سری ردههای ایدهآل از هر ویژگی یا متغیر بر اساس بیشترین درصدها به عنوان ملاک برای مقایسه الگوهای مختلف در نظر گرفته شده است؛ مدت زمان استفاده از اینترنت و فضای مجازی به منظور انجام هر یک از فعالیتهای وقتگذرانی در اینترنت به عبارتی گشتن در اینترنت بدون هدف؛ صحبت کردن/ گفتگو کردن و گپ زدن؛ مشارکتهای فرهنگی، سرگرمی و بازیها؛ مطالعه در اوقات فراغت؛ تماشاکردن/ گوش کردن تلویزیون و ویدئو به سه رده کم، متوسط و زیاد تقسیم شد، سپس برای هر الگو به صورت جداگانه درصد استفاده از اینترنت و فضای مجازی محاسبه شد و نهایتاً رده مصرف زیاد جهت مقایسه الگوهای ذکرشده در نظر گرفته شد (شکل3)):
نتیجهگیری
در مطالعه حاضر سعی ما بر این است که با کشف الگوهای پنهان استفاده از اینترنت و فضای مجازی به سوالات مطرح شده در بخش مقدمه پاسخ داده شود. برای این منظور روش خوشهبندی را مورد استفاده قرار دادیم و از آنجایی که دادههای ما شامل هر دو نوع ویژگیهای عددی و رستهای هستند، روش خوشهبندی k-نمونه اولیه را روی دادههای گذران وقت در فضای مجازی و اینترنت اجرا کردیم. نهایتاً سه الگوی استفاده از اینترنت و فضای مجازی حاصل شد که به طور کامل در بخش نتایج مورد بحث قرار گرفتند. با توجه به اهمیت موضوع اینترنت و فضای مجازی در عصر جدید، از نتایج حاصل از این مطالعه میتوان جهت اتخاذ تصمیمات و برنامهریزی در زمینه فعالیتهای اینترنتی مناسب برای گروههای مختلف افراد استفاده نمود، همچنین میتوان از آن به عنوان پیشزمینهای برای کارهای آینده در حوزه استفاده بهینه از اینترنت و فضای مجازی استفاده کرد.
مرجع:
چکیده نتایج طرح آمارگیری گذران وقت، تابستان (1399). تهران: مرکز آمار ایران.
رضائی قهرودی، زهرا؛ رنجی، حسن؛ رضایی، علیرضا. (1400). استفاده از الگوریتمهای یادگیری آماری ردهبندی در آمار رسمی. مجله علوم آماری–نشریه علمی پژوهشی انجمن آمار ایران, 15(1), 119-146.
Abe, S. (2012). Pattern classification: neuro-fuzzy methods and their comparison. Springer Science & Business Media.
Abe, S., and Inoue, T. (2002, April). Fuzzy support vector machines for multiclass problems. In ESANN (pp. 113-118).
Ahmad, I. (2014). K-Mean and K-Prototype Algorithms Performance Analysis. International Journal of Computer and Information Technology, 3, 823-828.
Bengio, Y., Goodfellow, I., and Courville, A. (2017). Deep learning (vol. 1). MIT Press.
Bezdek, J. C. (1981). Pattern Recognition with Fuzzy Objective Function Algorithms. Springer, Boston, MA.
Zhou, H., Zhang, Y., and Liu, Y. A Global-Relationship Dissimilarity Measure for the k-Modes Clustering Algorithm. Computational Intelligence and Neuroscience. Vol. 2017 (2017).