כיצד לכתוב ולבדוק מסנני Regex עבור Google Analytics (עם דוגמאות)
כמו ברבים מהמאמרים שלי כאן, אני עושה מחקר עבור לקוח ואז כותב על זה כאן. למען האמת, ישנן כמה סיבות מדוע ... ראשית היא שיש לי זיכרון נורא ולעתים קרובות אני מחפש את האתר שלי למידע. שנית היא לעזור לאחרים העשויים לחפש מידע.
מהו ביטוי רגולרי (Regex)?
Regex היא שיטת פיתוח לחיפוש וזיהוי תבנית של תווים בטקסט שתתאים או תחליף את הטקסט. כל שפות התכנות המודרניות תומכות בביטויים רגולריים.
אני אוהב ביטויים רגילים (regex) אבל הם יכולים להיות קצת מתסכלים או מקוממים ללמוד ולבדוק. ל- Google Analytics יש יכולות מדהימות ... שבהן אתה יכול ליצור תצוגות עם ביטויים רגולריים או לסנן את הנתונים שלך בביטויים רגולריים.
לדוגמא, אם הייתי רוצה לראות רק את התנועה בדפי התגים שלי, אוכל לסנן / לתייג / במבנה הקישור שלי באמצעות:
/tag\/
התחביר הוא קריטי שם. אם רק הייתי משתמש ב"תג ", הייתי מקבל את כל הדפים עם הכינוי מונח. אם השתמשתי ב- "/ tag", כל כתובת אתר שתתחיל בתג תיכלל, כמו / ניהול תג מכיוון ש- Google Analytics כברירת מחדל לכלול תווים כלשהם לאחר הביטוי הרגולרי. אז אני צריך לוודא שיש לי את הסלאש הבא ... אבל עליו להיות בעל אופי בריחה.
יסודות התחביר של Regex
תחביר | תיאור |
^ | מתחיל עם |
$ | נגמר עם |
. | תו כללי לכל דמות |
* | אפס או יותר מהפריט הקודם |
.* | תואם את כל התווים ב- |
? | אפס או פעם אחת של הפריט הקודם |
+ | פעם אחת או יותר מהפריט הקודם |
| | מפעיל OR |
[א ב ג] | A או b או c (יכול להיות מספר תווים כלשהו) |
[az] | טווח a עד z (יכול להיות מספר תווים כלשהו) |
[AZ] | טווח A עד Z (באותיות רישיות) |
[0-9] | טווח של 0 עד 9 (יכול להיות כל מספר) |
[a-zA-Z] | טווח של עד Z או A עד Z |
[a-zA-Z0-9] | כל התווים האלפאנומריים |
1 {} | מופע אחד בדיוק (יכול להיות כל מספר) |
{1-4} | טווח של 1 עד 4 מקרים (יכול להיות כל מספר) |
{1,} | מופע אחד או יותר (יכול להיות כל מספר) |
() | קבץ את הכללים שלך |
\ | בריחה מדמויות מיוחדות |
\d | אופי ספרתי |
\D | דמות לא ספרתית |
\s | חלל לבן |
\S | שטח לא לבן |
\w | Word |
\W | אי מילים (פיסוק) |
דוגמאות Regex עבור Google Analytics
בואו נביא כמה דוגמאות שם לחלק מסננים מותאמים אישית. אחד מעמיתיי ביקש ממני סיוע לזהות דף פנימי עם הנתיב של /אינדקס בנוסף לכל הפוסטים בבלוג שנכתבו עם השנה בפרמלינק:
דפוס הסינון המותאם אישית שלי עבור שדה הסינון כתובת אתר בקשה:
^/(index|[0-9]{4}\/)
זה בעצם קובע לחפש / להוסיף אינדקס או כל נתיב מספרי בן 4 ספרות שמסתיים עם קו נטוי נגרר. יצרתי תצוגה באנליטיקס והוספתי את זה כמסנן:
להלן מספר דוגמאות נוספות:
- יש לך בלוג עם השנה בנתיב הקישור של כתובת האתר ואתה רוצה לסנן את הרשימה לכל שנה. אז אני רוצה כל 4 ספרות מספריות ואחריהם קו נטוי נגרר. בקש תבנית מסנן URl:
^/[0-9]{4}\/
- אתה רוצה להשוות את כל הדפים שלך עם הכותרת תעודה or הסמכה בו. תבנית מסנן כותרת העמוד:
(.*)certificat(.*)
- אתה רוצה להשוות שני דפי נחיתה בהתבסס על מדיום הקמפיין שלהם שהועבר ב כתובת אתר של קמפיין בגוגל אנליטיקס כמו utm_medium = דואר ישיר or חיפוש בתשלום.
(direct\smail|paid\ssearch)
- אתה רוצה להשוות את כל המוצרים שהם חולצות גברים בהתבסס על נתיב כתובת האתר. בקש תבנית מסנן URl:
^/mens/shirt/(.*)
- ברצונך להשוות את כל הדפים שמוספרים בנתיב כתובת האתר שמסתיים במספר. בקש תבנית מסנן URl:
^/page/[1-9]*/$
- אתה רוצה לא לכלול טווח של כתובות IP. אל תכלול את תבנית המסנן של כתובת ה- IP:
123\.456\.789\.[0-9]
- אתה רוצה לכלול דף thankyou.html שבו ההגשה הצליחה בהתבסס על הצלחה בשורת השאילתות = true. בקש תבנית מסנן URl:
thankyou\.html\?success=true
כיצד לבדוק את ביטויי Regex שלך
במקום ניסוי וטעייה בתוך Google Analytics, אני לעתים קרובות פשוט קופץ אל 101, כלי נהדר לבדיקת הביטויים הרגילים שלך. זה אפילו מפרק את התחביר שלך עבורך ומספק את פרטי הביטוי הרגיל שלך: