כיצד לכתוב ולבדוק מסנני Regex עבור Google Analytics (עם דוגמאות)

ביטויים רגולריים מסנני Regex של Google Analytics

כמו ברבים מהמאמרים שלי כאן, אני עושה מחקר עבור לקוח ואז כותב על זה כאן. למען האמת, ישנן כמה סיבות מדוע ... ראשית היא שיש לי זיכרון נורא ולעתים קרובות אני מחפש את האתר שלי למידע. שנית היא לעזור לאחרים העשויים לחפש מידע.

מהו ביטוי רגולרי (Regex)?

Regex היא שיטת פיתוח לחיפוש וזיהוי תבנית של תווים בטקסט שתתאים או תחליף את הטקסט. כל שפות התכנות המודרניות תומכות בביטויים רגולריים.

אני אוהב ביטויים רגילים (regex) אבל הם יכולים להיות קצת מתסכלים או מקוממים ללמוד ולבדוק. ל- Google Analytics יש יכולות מדהימות ... שבהן אתה יכול ליצור תצוגות עם ביטויים רגולריים או לסנן את הנתונים שלך בביטויים רגולריים.

לדוגמא, אם הייתי רוצה לראות רק את התנועה בדפי התגים שלי, אוכל לסנן / לתייג / במבנה הקישור שלי באמצעות:

/tag\/

התחביר הוא קריטי שם. אם רק הייתי משתמש ב"תג ", הייתי מקבל את כל הדפים עם הכינוי מונח. אם השתמשתי ב- "/ tag", כל כתובת אתר שתתחיל בתג תיכלל, כמו / ניהול תג מכיוון ש- Google Analytics כברירת מחדל לכלול תווים כלשהם לאחר הביטוי הרגולרי. אז אני צריך לוודא שיש לי את הסלאש הבא ... אבל עליו להיות בעל אופי בריחה.

מסנן עמודים regex

יסודות התחביר של Regex

תחביר תיאור
^ מתחיל עם
$ נגמר עם
. תו כללי לכל דמות
* אפס או יותר מהפריט הקודם
.* תואם את כל התווים ב-
? אפס או פעם אחת של הפריט הקודם
+ פעם אחת או יותר מהפריט הקודם
| מפעיל OR
[א ב ג] A או b או c (יכול להיות מספר תווים כלשהו)
[az] טווח a עד z (יכול להיות מספר תווים כלשהו)
[AZ] טווח A עד Z (באותיות רישיות)
[0-9] טווח של 0 עד 9 (יכול להיות כל מספר)
[a-zA-Z] טווח של עד Z או A עד Z
[a-zA-Z0-9] כל התווים האלפאנומריים
1 {} מופע אחד בדיוק (יכול להיות כל מספר)
{1-4} טווח של 1 עד 4 מקרים (יכול להיות כל מספר)
{1,} מופע אחד או יותר (יכול להיות כל מספר)
() קבץ את הכללים שלך
\ בריחה מדמויות מיוחדות
\d אופי ספרתי
\D דמות לא ספרתית
\s חלל לבן
\S שטח לא לבן
\w Word
\W אי מילים (פיסוק)

דוגמאות Regex עבור Google Analytics

אז בואו נביא כמה דוגמאות שם מסננים מותאמים אישית. אחד מעמיתי ביקש ממני סיוע בזיהוי דף פנימי עם הדרך של /אינדקס בנוסף לכל הפוסטים בבלוג שנכתבו עם השנה בפרמלינק:

דפוס הסינון המותאם אישית שלי עבור שדה הסינון כתובת אתר בקשה:

^/(index|[0-9]{4}\/)

זה בעצם קובע לחפש / להוסיף אינדקס או כל נתיב מספרי בן 4 ספרות שמסתיים עם קו נטוי נגרר. יצרתי תצוגה באנליטיקס והוספתי את זה כמסנן:

מסנן התצוגה של Google Analytics

להלן מספר דוגמאות נוספות:

  • יש לך בלוג עם השנה בנתיב הקישור של כתובת האתר ואתה רוצה לסנן את הרשימה לכל שנה. אז אני רוצה כל 4 ספרות מספריות ואחריהם קו נטוי נגרר. בקש תבנית מסנן URl:

^/[0-9]{4}\/

  • אתה רוצה להשוות את כל הדפים שלך עם הכותרת תעודה or הסמכה בו. תבנית מסנן כותרת העמוד:

(.*)certificat(.*)

  • אתה רוצה להשוות שני דפי נחיתה בהתבסס על מדיום הקמפיין שלהם שהועבר ב כתובת אתר של קמפיין בגוגל אנליטיקס כמו utm_medium = דואר ישיר or חיפוש בתשלום.

(direct\smail|paid\ssearch)

  • אתה רוצה להשוות את כל המוצרים שהם חולצות גברים בהתבסס על נתיב כתובת האתר. בקש תבנית מסנן URl:

^/mens/shirt/(.*)

  • ברצונך להשוות את כל הדפים שמוספרים בנתיב כתובת האתר שמסתיים במספר. בקש תבנית מסנן URl:

^/page/[1-9]*/$

  • אתה רוצה לא לכלול טווח של כתובות IP. אל תכלול את תבנית המסנן של כתובת ה- IP:

123\.456\.789\.[0-9]

  • אתה רוצה לכלול דף thankyou.html שבו ההגשה הצליחה בהתבסס על הצלחה בשורת השאילתות = true. בקש תבנית מסנן URl:

thankyou\.html\?success=true

כיצד לבדוק את ביטויי Regex שלך

במקום ניסוי וטעייה בתוך Google Analytics, אני לעתים קרובות פשוט קופץ אל 101, כלי נהדר לבדיקת הביטויים הרגילים שלך. זה אפילו מפרק את התחביר שלך עבורך ומספק את פרטי הביטוי הרגיל שלך:

ביטויים רגולריים regex101

בנה, בדוק וניקוי באגים ב- Regex

מה אתה חושב?

אתר זה משתמש Akismet כדי להפחית דואר זבל. למד כיצד הנתונים שלך מעובדים.