تقسيم الخيط هي طريقة واحدة فقط لمعالجة بيانات السلسلة. يمكنك أيضًا إجراء استبدالات لاستبدال جزء من سلسلة بسلسلة أخرى. على سبيل المثال ، في سلسلة المثال (foo ، bar ، baz) ، يؤدي استبدال "foo" بـ "boo" إلى "boo، bar، baz". يمكنك القيام بذلك والعديد من الأشياء باستخدام الفرعية و gsub الأسلوب في فئة السلسلة.
خيارات كثيرة لاستبدال روبي
تأتي طرق الاستبدال في نوعين. ال الفرعية الطريقة هي أبسط من الاثنين وتأتي مع أقل عدد من المفاجآت. يستبدل ببساطة المثال الأول للنمط المعين بالاستبدال.
بينما الفرعية فقط يحل محل المثال الأول ، gsub يستبدل الأسلوب كل مثيل من النمط مع الاستبدال. بالإضافة إلى ذلك ، على حد سواء الفرعية و gsub يملك الفرعية! و gsub! نظرائه. تذكر الطرق روبي التي تنتهي بعلامة تعجب تغير المتغير في مكانه بدلاً من إرجاع نسخة معدلة.
بحث واستبدال
الاستخدام الأساسي لأساليب الاستبدال هو استبدال سلسلة بحث ثابتة بسلسلة استبدال ثابتة واحدة. في المثال أعلاه ، تم استبدال "foo" بـ "boo". يمكن القيام بذلك لأول ظهور "foo" في السلسلة باستخدام الفرعية طريقة أو مع جميع حالات "فو" باستخدام gsub طريقة.
#! / usr / bin / env ruby
أ = "فو ، بار ، باز"
b = a.sub ("foo"، "boo")
يضع ب
$ ./1.rb
فو ، بار ، باز
gsub $ ./1.rb
بو ، بار ، باز
بحث مرن
يمكن البحث عن سلاسل ثابتة حتى الآن. في النهاية ، ستواجه حالات حيث مجموعة فرعية من سلاسل أو سلاسل مع مكونات اختيارية يجب أن تكون متطابقة. بالطبع ، يمكن أن تتطابق طرق الاستبدال مع التعبيرات العادية بدلاً من السلاسل الثابتة. وهذا يسمح لهم بأن يكونوا أكثر مرونة وأن يتطابقوا فعليًا مع أي نص تحلم به.
هذا المثال هو عالم أكثر واقعية. تخيل مجموعة من القيم المفصولة بفواصل. يتم إدخال هذه القيم في برنامج جدولة لا يمكنك التحكم فيه (مغلق مصدر). البرنامج الذي يولد هذه القيم هو مصدر مغلق أيضًا ، ولكنه ينتج بعض البيانات سيئة التنسيق. تحتوي بعض الحقول على مسافات بعد الفاصلة وهذا يتسبب في كسر برنامج الجدولة.
أحد الحلول الممكنة هو كتابة برنامج روبي ليكون بمثابة "غراء" أو مرشح ، بين البرنامجين. سيقوم برنامج Ruby هذا بإصلاح أي مشاكل في تنسيق البيانات حتى يتمكن الجدولة من القيام بعمله. للقيام بذلك ، الأمر بسيط للغاية: استبدل فاصلة متبوعة بعدد من المسافات بفاصلة فقط.
#! / usr / bin / env ruby
STDIN.each يفعل | l |
l.gsub! (/، + /، "،")
يضع ل
النهاية
gsub $ cat data.txt
10, 20, 30
12.8, 10.4,11
gsub $ cat data.txt | ./2.rb
10,20,30
12.8,10.4,11
بدائل مرنة
تخيل الآن هذا الوضع. بالإضافة إلى التنسيق البسيط الأخطاء، يقوم البرنامج الذي ينتج البيانات بإنتاج بيانات رقمية في تدوين علمي. لا يفهم برنامج الجدولة هذا ، لذلك سيكون عليك استبداله. من الواضح أن gsub البسيط لن يعمل هنا لأن الاستبدال سيكون مختلفًا في كل مرة يتم إجراء الاستبدال.
لحسن الحظ ، يمكن أن تأخذ طرق الاستبدال كتلة لحجج الاستبدال. في كل مرة يتم فيها العثور على سلسلة البحث ، يتم تمرير النص الذي يطابق سلسلة البحث (أو التعبير العادي) إلى هذه الكتلة. يتم استخدام القيمة الناتجة عن الكتلة كسلسلة استبدال. في هذا المثال ، رقم فاصلة عائمة في شكل تدوين علمي (مثل 1.232e4) إلى رقم عادي بعلامة عشرية. يتم تحويل السلسلة إلى رقم مع to_f، ثم يتم تنسيق الرقم باستخدام سلسلة تنسيق.
#! / usr / bin / env ruby
STDIN.each يفعل | l |
l.gsub! (/-؟\d+\.\d+e-؟\d+/) تفعل | n |
"٪ .3f"٪ n.to_f
النهاية
l.gsub! (/، + /، "،")
يضع ل
النهاية
ملف gsub $ cat floatdata.txt
2.215e-1 ، 54 ، 11
3.15668e6 ، 21 ، 7
ملف gsub $ cat floatdata.txt | ./3.rb
0.222,54,11
3156680.000,21,7
لست على دراية بالتعبيرات العادية؟
دعونا نأخذ خطوة إلى الوراء ونلقي نظرة على ذلك تعبير عادي. تبدو غامضة ومعقدة ، لكنها بسيطة للغاية. إذا لم تكن على دراية بالتعبيرات العادية ، فقد تكون مشفرة تمامًا. ومع ذلك ، بمجرد أن تكون على دراية بها ، فهي طرق مباشرة وطبيعية لوصف النص. هناك عدد من العناصر ، والعديد من العناصر لها محددات كمية.
العنصر الأساسي هنا هو \د فئة الأحرف. سيطابق هذا أي رقم ، الأحرف من 0 إلى 9. يتم استخدام محدد الكمية + مع فئة أحرف الأرقام للدلالة على أنه يجب مطابقة واحد أو أكثر من هذه الأرقام في صف واحد. لديك ثلاث مجموعات من الأرقام ، اثنان مفصولين بعلامة "."والآخر مفصول بحرف"ه"(للأس).
العنصر الثاني الذي يطفو هو الحرف الناقص ، والذي يستخدم "?"محدد كمية. هذا يعني "صفر أو واحد" من هذه العناصر. لذلك ، باختصار ، قد تكون أو لا تكون هناك علامات سلبية في بداية العدد أو الأس.
العنصران الآخران هما. (فترة) حرف و ه حرف. اجمع كل هذا ، وستحصل على تعبير عادي (أو مجموعة من القواعد لمطابقة النص) يطابق الأرقام في شكل علمي (مثل 12.34e56).