فصل ۲۱ دایتل: رشته ها

توی این فصل در مبحث رشته ها در سی++ بیشتر عمیق میشیم. درواقع کلاس string از STL رو بررسی می‌کنیم.

پست کوتاهیه چون بیشتر چیزها رو بلد بودم 🙂

تابع compare

این تابع جالبیه که باهاش میتونیم بخش خاصی از یک رشته رو با بخش خاصی از یک رشته دیگه مقایسه کنیم.

اینطوری:

string str1{"This is string"};
string str2{"oh This string"};
if (str1.compare(0, 3, str2, 3, 5)) {
// do something
}

تابع replace و نکته‌ش

تابع replace میاد و از مکانی که براش مشخص می‌کنیم میگرده و مقدار مشخص شده رو پیدا می‌کنه و رشتهٔ جایگزین رو بجاش می‌ذاره.

نکته‌ش اینه که اگر مثلا شما دنبال یک رشته بگردید که ۲ کاراکتر داره و بخواین این زیر رشته رو با یک رشته که ۴ کاراکتر داره جایگزین کنید، ۲ کاراکتر بعد از رشته مورد جستجوی ما از بین میره.

الآن حوصله نوشتن مثال ندارم. امیدوارم گنگ نگفته باشم 🙂

برای اینکه به این مشکل برنخوریم بهتره که اول موقعیت رخداد رشته مورد جستجو رو با استفاده از تابع find پیدا بکنیم و بعد با استفاده از تابع insert رشته مورد نظرمون رو بذاریم بجاش.

تبدیل رشته به عدد

توابعی که برای اینکار وجود دارن اینا هستن:

توابع مربوط به تبدیل رشته به عدد

تابع هایی که می‌بینیم درواقع ۳ تا ورودی دارن(به جز تابع های مربوط به اعداد اعشاری که ورودی سوم رو ندارن) که دوتای آخرشون default دارن.

  • ورودی اول: رشته ای که میخوایم به عدد تبدیل بشه
  • یک اشاره گر به size_t برای ذخیره کردن اولین اندیسی که این تابع قادر به تبدیلش نبوده
  • یک عدد صحیح بین ۲ تا ۳۶ که مبنای عدد رو مشخص می‌کنه.

به عنوان مثال فرض کنیم str یک رشته است که مقدار “123” در اون ذخیره شده. اینطور میشه به int تبدیلش کرد:

int convertedInt = stoi(str, nullptr, 10);

دوتا آرگومان آخر دلخواه هستند و میشه اونهارو ننوشت.

پایان

خیلی خوبه که بیشتر نکات این چندفصل آخر رو بلد بودم و دارم سریع پیش میرم 🙂 باعث میشه اعتماد به نفس بهتری داشته باشم.

فصل ۱۷ دایتل: نگاهی عمیق تر به Exception Handling

توی این فصل قراره نکات عمیق تری رو راجع به مدیریت استثنا ها یاد بگیریم بنابراین مفاهیم اولیه مثل اینکه exception چی هست و چرا باید استفاده بشه و چطور میشه یک استثنا برای خودمون بنویسیم رو ذکر نمی‌کنم.

یادآوری

نکته اول اینکه همیشه باید سعی کنیم توی بلوک catch، تایپ مربوط به exception رو به صورت رفرنس بگیریم چراکه اولا از کپی شدن آبجکت اکسپشن جلوگیری میکنه و دوم اینکه باعث میشه اگر اکسپشن ما از stdexcept ارث بری شده، بتونه به درستی اجرا بشه.

یه بلاک try میتونه چندین بلاک catch رو بعد از خودش داشته باشه که هرکدوم یک استثنا خاصی رو هندل میکنن.

دو نوع مدل برای هندل کردن استثنا داریم:

termination model of exception handling

توی این مدل(که زبان سی++ از این مدل استفاده می‌کنه) وقتی داخل try یک اکسپشن پرت میشه(throw)، در همون نقطه از بلاک try بیرون میاد(اصطلاحا بهش میگن throw point) و بعد از پیدا کردن بلاک catch مورد نظرش میره و خطی که بعد از catch هست رو اجرا میکنه. نه خطی که بعد از throw point هست.

resumption model of exception handling

این مدل برعکس مدل بالاست و وقتی کار بلوک catch تموم میشه، برمیگرده و از ادامهٔ throw point یا همون نقطه پرتاب کد هارو اجرا می‌کنه.

با اینکه کلمهٔ throw میتونه هر چیزی رو پرت بکنه(مثل return) اما بهتره که فقط exception object رو پرت کنیم.

پرت کردن دوباره یک استثنا یا rethrowing exception

گاهی ممکنه وضعیتی پیش بیاد که نیاز باشه یک استثنا رخ داده شده رو چندبار پردازش کنیم. به عنوان مثال فرض کنید در یک تابع چند حافظه رو new کردیم و بعد از تخصیص حافظه و در جایی از این تابع یک exception پرت بشه. اینجا ما میخوایم هم حافظه ای که گرفته شده رو delete کنیم و هم به تابع صدا زننده‌مون اطلاع بدیم که در این تابع یک استثنا رخ داده.

برای اینکه اینکار انجام بشه کافیه در بلوک catch ای که داریم یکبار دیگه throw کنیم تا به تابع صدا زننده بره. کد زیر کاملا شفافه و با خوندنش میتونیم بفهمیم دقیقا منظور از rethrowing exception چیه.

مثال برای پرت کردن دوبارهٔ یک استثنا

Stack unwinding

وقتی یک استثنا پرتاب میشه، برنامه به دنبال یک بلوک catch می‌گرده که متناسب با استثنا پرتاب شده باشه. اگر در جایی(تابعی) که قرار داره نتونه یک catch رو پیدا بکنه، اون تابع رو terminate می‌کنه و میره به جایی که تابع ما داخلش صدا زده شده. اگر اونجا هم بلوک catch ای وجود نداشت که متناسب با استثنا پرت شده بود، باز هم تابع رو terminate میکنه و میره به تابع صدا زننده‌ش و این کار تا موقعی که بتونه یک catch رو پیدا کنه ادامه داره.

اگر هیچ catch متناسبی پیدا نشه در نهایت برنامه بسته میشه.

به این فرآیند میگن stack unwinding چراکه function stack رو پیمایش می‌کنه و دونه دونه به سمت تابع بیرونی حرکت می‌کنه.

مثال زیر به روشن شدن ماجرا کمک می‌کنه:

کلمه noexcept

اگر تابعی داشته باشیم که به هیچ عنوان استثنا ای رو پرت نمی‌کنه یا توابعی رو صدا میزنه که اونها هم استثنا ای رو پرت نمی‌کنن، میتونیم صراحتا به عنوان تابعی که استثنا نداره تعریفش کنیم:

int functionWithoutException() noexcept;

اینکار به کسای دیگه (و حتی خودمون) کمک میکنه که وقتی داریم کد رو می‌خونیم بدونیم این تابع هیچجوره استثنا رو پرت نمی‌کنه و بنابراین با خیال راحت میتونیم خارج از بلوک try قرارش بدیم.

نکته: اگر تابع ما const هست،‌ حتما کلمهٔ noexcept رو باید بعد از const بذاریم. نمیدونم چرا.

استثنا در Constructor و Destructor

یه سری نکات وجود داره که بهش می‌پردازیم:

  • از اشیاء ای که به صورت گلوبال تعریف شدن و اشیاء ای که به صورت static تعریف شدن نباید استثنا ای پرت بشه چرا که این اشیاء قبل از main ساخته میشن و نمیشه catch کردشون.
  • اگر یک شئ رو با استفاده از new ساخته باشیم و در کانستراکتورش یک استثنا رخ بده، اون حافظه ای که گرفته شده خود به خود آزاد میشه.
  • اگر کانستراکتور حافظه ای رو تخصیص داده، قبل از اینکه استثنا ای رو پرت بکنه باید حتما حافظه ای که گرفته رو پاک کنه!

استثنا ها در new

یکی از ویژگی های جالب سی++ که نظرمو جلب کرد، تابع set_new_handler (از هدر <new>)بود. این تابع یک تابع(بدون ورودی و خروجی void) رو به عنوان ورودی خودش میگیره و هر زمان و هرجای برنامه که موقع new کردن یک حافظه، مشکلی ایجاد بشه، اون تابع رو فراخوانی می‌کنه.

اگر تابع handler رجیستر نشده باشه،‌ در حالت پیشفرض new میاد و استثنا bad_alloc رو پرتاب می‌کنه.

کلاس unique_ptr

توضیحاتش زیاده ولی اگر مختصر بخوام بگم، یکی از اشاره گر های هوشمند سی++ هست که این نیاز رو که مجبوریم هر حافظه ای که گرفتیم رو به صورت دستی delete کنیم از بین می‌بره. خودش به صورت خودکار وقتی که out of scope بشه، حافظه رو برمیگردونه به سیستم.

یه مثال ازش میزنم: (کلاس Integer کار خاصی نمی‌کنه. فقط موقع نابود شدن یه متن چاپ میکنه و یه setter و getter داره)

تابع make_unique درواقع کار همون new رو انجام می‌ده و خط ۱۴ رو میشه به این شکل هم نوشت:

unique_ptr<Integer> ptrToInteger {new Integer(7)}

مالکیت در unique_ptr

هر اشاره گری فقط میتونه توسط یک شئ unique_ptr مدیریت بشه و این امکان که یک اشاره گر توسط چند شئ مدیریت بشن وجود نداره. درواقع وقتی یک شئ از این کلاس به یک شئ دیگه نسبت داده میشه(assign)، مالکیت اشاره گر از شئ سمت راست به شئ سمت چپ منتقل میشه.

این موضوع باعث میشه که بتونیم از unique_ptr برای پاس دادن آرگومان ها به تابع و یا برگردوندن اشاره گر از یک تابع استفاده بکنیم.

سلسله مراتب Exception های استاندارد

سلسله مراتب استثناهای استاندارد

با catch کردن کلاس والد، همه استثنا هایی که فرزند اون کلاس هستند هم catch می‌شن.

اگر می‌خوایم همهٔ انواع استثنا هارو catch بکنیم، میتونیم اینطوری بنویسیم:

catch (...) { // code here }

یکی از بدیای این روش اینه که دیگه نمی‌تونیم به جزئیات ارور دسترسی داشته باشیم. البته، اگر در سطوح پایین تر(توابعی که تابع موجود رو صدا زدند) catch ای وجود داشته باشه، میتونیم با rethrow کردن استثنا به جزئیات هم دسترسی داشته باشیم.

پایان

در فصل بعد درباره Template ها صحبت می‌کنیم. فصل باحالیه.

نکات جدیدی که از فصل ۱۵ دایتل یاد گرفتم – کتابخانه استاندارد

توی این فصل سه بخش از کتابخانه استاندارد سی++ که بهش STL هم میگن رو بررسی می‌کنیم. container ها، iterator ها و algorithm ها. فصل بسیار مهمیه چراکه این کتابخونه بسیاری از کار های مارو راحت تر می‌کنه و اگر خوب بلد باشیم ازش استفاده کنیم، دهن خودمون رو برای پیاده سازی کردن خیلی از چیز ها صاف نمی‌کنیم.

کانتینر ها

کانتینر ها یک ساختمان داده ای هستند که تقریبا میشه همه نوع داده ای رو توشون ذخیره کرد. درکل سه نوع کانتینر داریم که به شکل زیر دسته بندی میشن:

  • first class containers
  • container adapters
  • near containers

یک نوع دسته بندی دیگه هم وجود داره که کانتینر هارو به ۴ بخش تقسیم می‌کنه:

  • Sequence containers
  • Ordered associative containers
  • unordered associative containers
  • container adapters

بخش sequence containers و associative containers درواقع به عنوان first class container در نظر گرفته میشن.

container adapter در اصل همون first class container ها هستن که عملیات هاشون محدود شده. این کانتینر شامل استک، صف و … هست.

یک نوع کانتینر دیگه هم داریم که بهشون میگن near containers. دلیل اینکه اسمشون رو به این شکل انتخاب کردن اینه که این کانتینر ها بعضی از قابلیت های first-class container هارو دارن و بخش دیگه ایشون رو ندارن. مثالی که میشه از این کانتینر ها زد؟ built-in array ها، کلاس های مربوط به bitset و valarray ها(که برای انجام عملیات های سریع ریاضی روی وکتور ها* بکار میره) و …

*اون وکتور، با vector ای که توی کانتینر ها داریم فرق داره.

توی جدول زیر میتونیم لیست کانتینر ها و ویژگی‌هاشون رو ببینیم که خیلی جالبه:

نکاتی درباره پرفورمنس کانتینر ها

  • اضافه/حذف کردن به/از آخر vector ها سریعه. اما اضافه/حذف کردن به/از اول و یا وسط vector ها به صرفه نیست
  • اگر نیاز داریم که صورت مفرط به ابتدا/انتها کانتینرمون المان اضافه(یا حذف) بکنیم بهتره از deque (تلفظ میشه دِکْ) استفاده بکنیم چرا که عملیات هاش در ابتدا و انتهای کانتینر سریعن
  • در آخر اگه نیاز داریم که در وسط کانتینر هم چیزی رو حذف کنیم یا اضافه کنیم، بهتره از list استفاده بکنیم.

Sequence Container ها:

وکتور ها (vector)

وکتور کانتینری هست که از خونه های متوالی حافظه استفاده میکنه. در واقع در لایه های زیرین وکتور میاد و با یک اندازه ثابت یک آرایه تخصیص میده. بعد از پر شدن آرایه، یک آرایه با اندازهٔ بیشتر از حافظه میگیره و اطلاعات آرایه قبلی رو در آرایه جدید کپی میکنه(یا move میکنه) و آرایه قبلی رو حذف می‌کنه. در واقع این قابلیت آرایه بودن این امکان رو بهش میده که بشه به صورت آنی به المان های وکتور دسترسی پیدا کرد.

اگر می‌دونیم که حدودا قراره چه مقدار داده به وکتور اضافه کنیم، بهتره با استفاده از توابع resize یا reserve اون حافظه رو برای وکتور بگیریم تا از تخصیص و حذف پی در پی حافظه جلوگیری کنیم. C++11: shrink_to_fit

اینکه چطور یک وکتور اقدام به افزایش حافظه میکنه بستگی به پیاده سازی داره و ممکنه توی کامپایلر های مختلف، نتیجهٔ متفاوتی داشته باشه. در حالت کلی این یک time-space tradeoff هست.

فرق بین clear و erase

فرق این دو این هست که تابع clear کل اعضای وکتور رو پاک میکنه اما erase این قابلیت رو داره که تک عضو و یا یک رنج از عضو ها رو از وکتور پاک کنه.

لیست ها (list)

لیست که درواقع یک لیست دو پیوندی هست (doubly linked list) اجازهٔ اضافه و حذف کردن سریع در هر جای کانتینر رو میده اما در حالت کلی اگر بیشتر عملیات هامون قراره در دو انتهای کانتینر باشه، بهتره که از دِک (deque) استفاده کنیم.

تابع unique

این تابع عناصر تکراری یه کانتینر رو حذف می‌کنه. البته برای اینکه درست کار کنه کانتینر ما از قبل باید سورت شده باشه تا عناصر تکراری کنار هم قرار بگیرن.

دِک ها (deque)

کلاس دک درواقع نکات مثبت وکتور و لیست رو توی خودش جمع کرده. کلمهٔ deque کوتاه شدهٔ double-ended queue هست. این کلاس قابلیت دسترسی سریع و مستقیم به عناصر داره و همچنین عملیات هایی که در دو سمت انتهایی این کانتینر انجام میشن سریعن.

از اونجایی که از random-access iterator ها ساپورت میکنه بنابراین همهٔ الگوریتم های کتابخونه استاندارد میتونن روی این کلاس اعمال بشن.

در حالت کلی دک سربار بیشتری از وکتور داره و همچنین حذف و اضافه کردن در وسط دک ها بهینه تر از وکتوره(همچنان کند تر از لیست ها)

حالا که یک دید کلی از Sequence container ها داریم، به Associative Container ها می‌پردازیم:

این کانتینر ها قابلیت این رو به ما میدن که با استفاده از یک کلید بتونیم به صورت مستقیم به مقادیر مورد نظرمون دسترسی داشته باشیم. ۸ نوع کلاس وجود داره که ۴ تای اول کلید هارو به صورت مرتب ذخیره میکنن و ۴ تای دوم، ترتیب کلید ها براشون مهم نیست.

multiset, set, multimap, map
unordered_multiset, unordered_set, unordered_multimap, unordered_map

کلاس های set و multiset به ما یه مجموعه ای از مقادیر رو میدن که خود اون مقدار ها، کلید هم هستن. فرق اصلی این دو کلاس اینه که کلاس set اجازه نمیده مقادیر تکراری به مجموعه اضافه بشن اما کلاس multiset این اجازه رو میده.

کلاس های map و multimap یه مجموعه به ما میدن که هر کلید، به یک مقدار وصله. فرقشون هم اینه که در کلاس map نمیشه یک کلید چند مقدار متفاوت داشته باشه اما این امر توی multimap امکان پذیره.

کلاس multiset

این کلاس که از هدر <set> میتونیم بهش دسترسی داشته باشیم به ما قابلیت ذخیره سازی و بازیابی سریع مقادیر رو میده همچنین قابلیت این رو داره مقادیر تکراری رو ذخیره کنه. این کلاس برای مرتب کردن عناصرش از چیزی به نام comparator function object استفاده می‌کنه که توی فصل بعد بهش می‌پردازیم. اگر ترتیب مقدار ها مهم نیست بهتره که از unordered_multiset استفاده بکنیم چراکه سربار کمتری داره(هدر<unordered_set>) . مثال برای استفاده از multiset:

std::multiset <int, less<int>> values;

که در اینجا اون less<int> یک comparator function object هست(اختیاری) و باعث میشه مقادیر ما به صورت صعودی مرتب بشن.

کلاس set

این کلاس تنها فرقی که با multiset داره اینه که عناصر تکراری رو ignore میکنه و درواقع همهٔ عناصر موجود در اون، یکتا هستن.

کلاس multimap

این نوع از associative container که از طریق هدر map میشه بهش دسترسی داشت به ما این قابلیت رو میده که مقادیر رو به صورت «جفت» (pair) ذخیره کنیم. یعنی اینکه به ازای هر مقدار، یک کلید وجود داره. اینکه کلید ها به چه ترتیبی مرتب بشن رو میشه از طریق comparator function ها تعیین کرد. کلاس multimap اجازه میده که کلید های تکراری داشته باشیم یعنی یک کلید میتونه چندین مقدار داشته باشه که بهش میگن one-to-many relationship و احتمالا بخاطر همینه که برای این کلاس random-access iterator نذاشتن.

کلاس map

این کلاس شبیه multimap عه تنها با این تفاوت که امکان وجود کلید تکراری نیست. یعنی هر کلید فقط به یک مقدار اشاره میکنه (one-to-one mapping) و همچنین این قابلیت وجود داره که به مقدار هر کلید به صورت آنی دسترسی داشته باشیم. ( با استفاده از اوپراتور []).

هردو کلاس قبلی که گفته شد دارای یک نسخه غیر مرتب هم هستند که سربار کمتری داره و برای استفاده ازشون کافیه یه unordered_ پشت اسم کلاس بذاریم.

نکاتی درباره Container Adapter ها:

این کانتینر ها در اصل همون first class container ها هستند که عملیات هاشون محدود شده و از iterator پشتیبانی نمی‌کنن. بنابراین لایه زیرین کلاس های این کانتینر از کلاس های first class container ها تشکیل میشه.

  • کلاس stack که یک استک رو میسازه، به صورت پیشفرض از deque استفاده می‌کنه.
  • کلاس queue که یک صف رو میسازه، به صورت پیشفرض از deque استفاده می‌کنه.
  • کلاس priority_qeueu که یک صف اولویت دار رو میسازه(صفی که مقادیر داخلش معمولا با استفاده از تکنیک heap، مرتب شده‌ند)، به صورت پیش‌فرض از کلاس vector به عنوان لایه زیرین خودش استفاده می‌کنه comparator function هم داره.

پیمایش کننده ها (Iterators)

ایتریتور ها چیزی شبیه به پوینتر ها هستند که قابلیت های بیشتری دارن و برای دسترسی و تغییر المان های یک کانتینر بکار میرن. مکانیسم دسترسی و پیمایش در یک کانتینر رو کپسوله میکنن و این به الگوریتم ها اجازه میده که بدون وابستگی به پیاده سازی لایه کانتینر، بتونن کار خودشون رو انجام بدن.

چند تابع داریم که میتونن برامون یک iterator برای یک کانتینر و یا حتی یک آرایه بسازن.

توابع begin و end که یک اشاره گر به اعضاء کانتینر میسازن( از سی++ ۱۱ به بعد میتونن یک پوینتر از built-in array ها بسازن حتی) و توابع cbeing, cend که یک ایتریتور const میسازن و rbegin, rend, crbegin, crend که قابلیت پیمایش برعکس روی یک آرایه رو میدن(از سی++ ۱۴ به بعد).

الگوریتم ها

الگوریتم ها شامل پیاده سازی ساختمان داده ها، الگوریتم های جستجو، مقایسه و مرتب سازی هستن که معمولا از ایتریتور ها استفاده میکنن. ایتریتور هایی که یه کانتینر ساپورت میکنه مشخص میکنه که آیا اون کانتینر میتونه از یه الگوریتم خاص استفاده بکنه یا نه. در مورد این بخش توی فصل بعدی کتاب به صورت مفصل بحث شده.

خب این فصل تقریبا طولانی هم تموم شد. هرچند مثل همیشه خیلی روش تمرکز نداشتم. اما تازگی دارم از تکنیک پومودورو استفاده می‌کنم و فعلا که جواب داده. فصل بعد هم درباره کتابخانه استاندارد صحبت می‌کنیم و بیشتر تمرکزمون روی بخش الگوریتم های این کتابخونه هست. بوس.