بخش اول : مفاهیم پایه و پیش‌نیازها
بخش دوم : جعبه ابزار یک مهندس داده
1 از 2

مدیریت ورودی و خروجی

در لینوکس، هر برنامه یا دستور متنی معمولاً با ورودی، خروجی و خطاها سروکار دارد. توانایی کنترل و هدایت این جریان‌ها، یکی از مهارت‌های کلیدی برای مهندسین داده و توسعه‌دهندگان است.

  • چرا مهم است؟
    • امکان پردازش داده‌ها به صورت زنجیره‌ای با Pipe )|)
    • ذخیره نتایج یا خطاها برای تحلیل و گزارش‌گیری
    • اجرای خودکار دستورات روی داده‌های بزرگ با xargs
    • کنترل و نادیده گرفتن خروجی‌های غیرضروری با /dev/null
  • به عبارت دیگر، مدیریت درست ورودی و خروجی باعث می‌شود که بتوانید داده‌ها را به صورت مؤثر، امن و قابل اتکا پردازش کنید و جریان‌های کاری خود را در پروژه‌ها بهینه کنید.

این بخش، پایه و اساس بسیاری از اسکریپت‌ها، اتوماسیون‌ها و پردازش‌های داده در محیط‌های لینوکس را شکل می‌دهد و یادگیری آن برای هر مهندس داده ضروری است.

  1. stdin (ورودی استاندارد) → جریانی که دستور از آن داده دریافت می‌کند
  2. stdout (خروجی استاندارد) → جریانی که دستور نتیجه را به آن ارسال می‌کند
  3. stderr (خطاهای استاندارد) → جریانی که پیام‌های خطا به آن ارسال می‌شوند

📤 هدایت خروجی (Redirection)

  • خروجی به فایل
command > output.txt
  • اضافه کردن خروجی به انتهای فایل
command >> output.txt
  • ورودی از فایل
command < input.txt
  • Here Document – <<
cat >matn.txt << EOF
این یک متن نمونه است
برای تست ورودی چند خطی 
که در فایل 
matn.txt
ذخیره میشود.
EOF

🔗 Pipe (|)

  • خروجی یک دستور را به ورودی دستور دیگر می‌فرستد:
cat file.txt | grep "error"
  • ترکیب چند دستور برای پردازش پیچیده‌تر:
ps aux | grep python | awk '{print $2}'

📦 ابزار xargs

  • خواندن ورودی و اجرای دستور برای هر آیتم:
cat files.txt | xargs rm
  • استفاده برای ترکیب با دستورات find:
find . -name "*.log" | xargs rm

⚠️ مدیریت خطاها

  • هدایت stdout و stderr به فایل‌ها:
command > output.txt 2> error.txt
  • هدایت خطاها به همان فایل خروجی:
command > all_output.txt 2>&1
  • نادیده گرفتن خروجی یا خطاها:
command > /dev/null 2>&1

🔑 نکات کلیدی

  • > و >> برای هدایت خروجی به فایل استفاده می‌شوند.
  • < و << برای خواندن ورودی از فایل یا متن چندخطی کاربرد دارند.
  • | برای اتصال دستورات و پردازش زنجیره‌ای داده‌ها بسیار پرکاربرد است.
  • xargs امکان اجرای دستورات روی لیست طولانی از داده‌ها را می‌دهد.
  • ۲> و ۲>&1 برای مدیریت پیام‌های خطا استفاده می‌شوند.
  • هدایت خروجی‌ها به /dev/null زمانی مفید است که نمی‌خواهیم خروجی یا خطایی نمایش داده شود.

📌 یادآوری: تمرین‌های عملی با Redirection، Pipe، xargs و مدیریت خطاها در مخزن گیت پروژه قرار گرفته است.

فروشگاه
جستجو
دوره ها

لطفا کلمات کلیدی را وارد کنید