Thursday, 7 December 2017

الانتقال من المتوسط ، ناشز الكشف


يستكشف المؤلفون كيف يمكن الكشف عن زلات دورة في قياسات المرحلة الحاملة غاليليو أكثر فعالية باستخدام أربعة ترددات. رؤى الابتكارات مع ريتشارد لانغلي المزيد من الاقمار أو إشارات أخرى كان هذا هو السؤال الذي طرح على المندوبين في غنس إلكتيون 08، الترفيه المحفزة والمسلية التي قدمت في عشاء القيادة العالمية غس الذي عقد بالتزامن مع اجتماع معهد الملاحة في سافانا في سبتمبر 2008. وأثناء المناقشة التي دارت قبل الانتخابات، دعا الطرف الساتل إلى أن يكون مجتمع المستعملين في الشبكات العالمية لسواتل الملاحة أفضل خدمة من خلال عدد أكبر من السواتل من الإشارات الأخرى. وذهبوا إلى أن المزيد من الأقمار الصناعية (أكثر من تلك الموجودة في كوكبة نظام تحديد المواقع العالمي) ستمكن من تحديد مواقع أكثر اتساقا وموثوقية في المدن والمناطق الجبلية وغيرها من البيئات الصعبة، وأن الإشارات القديمة لنظام تحديد المواقع العالمي (غس) كافية. وأوضح جريج توريتسكي، أحد مرشحيها، أنني سأحافظ من وجهة نظر اقتصادية على أن من الأفضل من حيث التكلفة بالنسبة إلى ناخبينا أن يكونوا أكثر من نفس الأقمار الصناعية لمنحهم المزيد من نفس الخدمات التي يتمتعون بها اليوم، في مناطق أخرى ، بدلا من خلق أشياء جديدة التي لا فائدة لها. ومن ناحية أخرى، دعا حزب الإشارة إلى الحصول على مزيد من الإشارات مع أجهزة استقبال قادرة على استخدامها لتوفير دقة عالية لطيف واسع من استخدامات النظم العالمية لسواتل الملاحة. وقال المرشح حزب إشارة جواد أشجيي، نحن حزب بناء الطرق، وتوليد خرائط دقيقة، وتزايد الطعام الخاص بك عن طريق أتمتة الزراعة، وتزامن محطات الطاقة الخاصة بك. ونحن نعمل حتى على هبوط الطائرات تلقائيا لاستخدام المجال الجوي بشكل أكثر كفاءة. وعلى الرغم من الاعتراض على الانتخابات فاز الحزب الساتل، 62 صوتا مقابل 46. ولكن من الواضح أن كلا الجانبين عرضت تقدمات مفيدة لمجتمع مستخدمي النظام العالمي لسواتل الملاحة، فلماذا لا نعمل معا، ودخول الأطراف في تحالف، وتوفير كل من الأقمار الصناعية والمزيد من الإشارات بسرعة إلى عام 2016. وقد حان التحالف لتمرير ولدينا أفضل من كلا العالمين. ولدينا مجموعتان كاملتان من النظم العالمية لسواتل الملاحة (غس) ونظام تحديد المواقع العالمي (غس) ونظام غلوناس، مع نظامين آخرين هما غاليليو و بيدو، على الطريق الصحيح لاستكمالهما في غضون السنوات القليلة المقبلة. ولدينا أيضا نظم إقليمية إما توفير خدمة تحديد المواقع المحلية المستقلة أو زيادة نظام تحديد المواقع مع نافيك (المعروف أيضا باسم النظام الهندي للملاحة الفضائية الإقليمية) و ق، على التوالي. ناهيك عن العدد المتزايد من سواتل نظام التعزيز الساتلي. عندما جمعت "تقويم" لقضية آب / أغسطس، كان هناك أكثر من 100 من سواتل النظام العالمي للملاحة بالأقمار الصناعية ترسل إشارات إلى المستخدمين. وليس فقط إشارات أكثر من المزيد من الأقمار الصناعية، ولكن إشارات أكثر تقدما من الناحية التكنولوجية على المزيد من الترددات. والواقع أن العدد الكبير من الإشارات التي ترسلها حاليا سواتل النظام العالمي للملاحة بالأقمار الصناعية يؤدي بالفعل إلى المزيد من التقدم في تحديد المواقع والملاحة والتوقيت (1) قبل أن تتحول كوكبات كاملة إلى تلك الإشارات. ومن الأمثلة الجيدة على ذلك خدمة غاليليوس المفتوحة التي تنتقل في النطاقين E1 و E5. وتستعمل نسخة معدلة من التشكيل الثنائي الإزاحة (بوك)، تسمى بوك البديلة أو ألتبوك، لتوليد إشارة E5 عريضة النطاق. وبنيته بحيث يمكن للمستقبل أن يتتبع ويصنع قياسات على الجزء الأدنى التردد فقط من الإشارة التي تركز على التردد مهز 1176،450 (E5a)، فإن الجزء العلوي للترددات يتركز على مهز 1207،140 (E5b)، وكل إشارة ألتبوك مركزة على التردد مهز 1191،795 (E5ab)، أو أي مزيج من هذه بما في ذلك جميع الثلاثة. باستخدام كل ثلاثة جنبا إلى جنب مع إشارة E1 يوفر لنا القدرة على تحديد المواقع أربعة تردد. ما فائدة الاستفادة من أربعة ترددات هناك عدة، ولكن في هذا العمود أشهر، تخرج مؤخرا الطالب الحائز على جائزة البلجيكي ومشرفها تخبرنا كيف زلات دورة في قياسات المرحلة الناقل غاليليو يمكن الكشف عن أكثر فعالية وكفاءة باستخدام أربعة ترددات. ويتيح توافر البيانات المقدمة في خدمة غاليليو المفتوحة للنظام العالمي للملاحة بالأقمار الصناعية على أربع ترددات للموجة الحاملة الطريق إلى حلول جديدة متعددة الترددات للمستخدمين المدنيين. في البحث الوارد في هذه المقالة، ركزنا على واحدة من عواقب خسارة تتبع الإشارة، وظهور زلات دورة، وكيف يمكن استخدام الترددات الأربعة تساعد في الكشف عنها. الكشف عن زلة دورة هو القضية الرئيسية لتطبيقات تحديد المواقع عالية الدقة. يجب أن يكون أي مستخدم في حاجة إلى تحديد موقف دقيق وموثوق بها على بينة من احتمال وجود زلات دورة في البيانات الخاصة بهم، لأنها تضر جودة البيانات. تقليديا، تم استخدام ترددين حاملات لتحديد المواقع على سبيل المثال، ترددات L1 و L2 غس. في الآونة الأخيرة، وقد سمحت ثلاث حاملات المواقع تعزيز الدقة والدقة. على الرغم من أن استخدام تردد الناقل الثالث قد سمح لنا أن تحل جزئيا قضية الكشف عن زلة دورة، والإجراءات الحالية لا تزال تفتقر إلى بعض الجوانب. ويتمثل أحد التحديات الرئيسية اليوم في كشف الانزلاق على الدراجات تحت النشاط الأيونوسفيري العالي، ولهذا السبب ركزنا على دراسة الحالة هذه. وبما أن استخدام ثلاثة ترددات يساعد على تحسين الكشف عن الانزلاق دورة موثوق بها، قد لا استخدام رابع إضافي تردد زيادة تحسين القدرة على الكشف منذ غاليليو إمدادات أربعة ترددات في خدمتها المفتوحة، كنا نظن أننا قد تكون قادرة على تحسين دورة الانزلاق أداء خوارزمية الكشف مرة أخرى. الإطار. في هذه المقالة، يتم عرض خوارزمية الكشف عن زلة دورة رباعية التردد الجديدة على ما يبدو، مسار غير مستكشفة في الأدب حتى الآن. وتستخدم الخوارزمية عمليات رصد لموجة حاملة غير متمايزة من مستقبل ثابت ثابت لمحطة واحدة. وضعت لأول مرة لمرحلة ما بعد المعالجة، وخوارزمية أيضا تم تكييفها لتطبيقات في الوقت الحقيقي. وتهدف هذه الخوارزمية إلى تحسين كشف انزلاق الدورة تحت النشاط الأيونوسفيري العالي. سيكل سليبس على الرغم من أن قياسات الكود (بسيودورانج) تستخدم عادة لتحديد المواقع القياسية، فإن أي تطبيق لتحديد المواقع بدقة يحتاج إلى استخدام قياسات مرحلة الناقل، وذلك بسبب جودة أفضل. لسوء الحظ، فإن هذه الأخيرة يمكن أن تخضع ل زلات دورة، توليد التحيز المستمر في البيانات، وإذا لم يتم الكشف عنها وغير مصححة، مما يؤثر على تحديد المواقع المستنبطة. وتجرى قياسات طور الموجة الحاملة من خلال مراقبة مرحلة الفارق، أي الفرق بين الموجة الحاملة المستقبلة من الساتل والنسخة المتماثلة المتولدة عن المستقبل. في فترة الملاحظة الأولى، لا يمكن قياس سوى جزء الكسور من هذه المرحلة ضربات، ولكن الإزاحة الصحيحة بين إشارة الأقمار الصناعية والنسخة المتماثلة المستقبل غير معروف. ويسمى هذا العدد الصحيح من الدورات الغموض المرحلة الأولية ويبقى ثابتا خلال فترة المراقبة. وتعطى المرحلة الحاملة التي يمكن ملاحظتها (بين الساتل i والمستقبل p) بالأمتار بالمعادلة التالية: حيث يشير الحرف f f إلى مصطلح الاعتماد على التردد وعلى المرحلة الحاملة التي يمكن ملاحظتها. G هو المصطلح الهندسي (أي دالة النطاق الهندسي بين المستقبل والساتل المجاور والتأخر التروبوسفيري والتحيز على مدار الساتل والاستقبال على مدار الساعة)، I هو التأخر الأيونوسفيري، M هو الخطأ في تعدد المسيرات، ويقف هو الأقمار الصناعية وأجهزة الاستقبال التأخير، ج هو سرعة فراغ الضوء، N هو الغموض المرحلة الأولية، وهو الخطأ العشوائي (وتسمى أيضا الضوضاء المرحلة). في فترة الملاحظة الأولى، يتم تهيئة عداد صحيح، ومع استمرار التعقب، يتم زيادة ذلك من خلال دورة واحدة كلما تغيرت مرحلة فوز من 2 إلى 0. إذا كان المتلقي حتى يفقد لفترة وجيزة المسار على إشارة، يتم تعليق العد ويتم فقدان عدد صحيح من الدورات. ويمكن أن تنتج هذه الخسارة عن أسباب مختلفة (إعاقة الإشارة، والتغير السريع في المرحلة الحاملة التي يمكن ملاحظتها، وما إلى ذلك). وفي معادلة الملاحظة، ستظهر زلة الدورة كتغير في قيمة الغموض في المرحلة الأولية. وهكذا، فإن زلة دورة واحدة تنطوي على تحول في طور الطور يبلغ حوالي 20 سنتيمترا (يساوي الطول الموجي الحامل)، تبعا لتردد الموجة الحاملة المتأثرة. يمكن أن يكون حجم دورة الانزلاق أي قيمة من واحد إلى آلاف من الدورات. التأخير الأيونوسفيري هو المصطلح الوحيد الذي يمكن الخلط بينه وبين زلة دورة صغيرة. في الواقع، خلال حدث الاضطراب الأيونوسفيري، غالبا ما يصل هذا الاختلاف في التأخير بين حقوتين من فترات المراقبة (متباعدة على فترات 30 ثانية) إلى 20 سنتيمترا (حجم انزلاق دورة واحدة في قياس المرحلة) أو أكثر. ويترتب على نشاط الأيونوسفير عواقب رئيسية. أولا، كما ذكر من قبل، يمكن إخفاء الزلات في ضوضاء المراقبة (بما في ذلك التباين الأيونوسفيري) وعدم الكشف عنها. ثانيا، يمكن أن تتغير إشارة وردت يسبب فقدان القفل، وبالتالي زلات دورة. وهناك الكثير من تكوينات مختلفة يمكن أن تنشأ عندما يتم فقدان إشارة. ويمكن أن يتوقف تعقب الإشارة على موجة حاملة وحيدة تؤدي إلى انزلاق دورة منعزلة (إكس) أو في وقت واحد على موجات حاملة متعددة. وفي الحالة الثانية، يمكن أن يكون حجم الانزلاق على الموجات الحاملة المختلفة هو نفسه (زلات دورة متزامنة من نفس الحجم، أو سس-سم) أو مختلفة (زلات دورة متزامنة بمقادير مختلفة أو سس-دم). كشف التاريخ. تم تطوير أول خوارزمية الكشف عن زلة الدورة باستخدام الملاحظات غير المتمايزة، توربو تحرير، في عام 1990 من قبل جيوف بليويت. وتستعمل قياسات الشفرات والطور من ترددين حاملات. وقد تم تنفيذه في العديد من برامج معالجة البيانات، مثل جيبسي-أواسيس إي، باندا و بيرنيز. وقد تم تعزيز خوارزمية تحرير توربو عدة مرات. في أحدث إصدار لها، تم تكييفها للكشف عن زلات دورة تحت النشاط الأيونوسفيري عالية، لكنه لا يزال تقنية مزدوجة التردد. ويتيح توافر تردد إشارة ثالث متزامن تطوير توليفات جديدة من الملاحظات. وقد قام أندرو سيمسكي بتطوير توليفة من الطور المنخفض للضوضاء منخفضة فقط من أجل التخلص من المصطلحات الهندسية والأيونوسفيرية من الدرجة الأولى وتطبيقها على كشف انزلاق الدورة. كما أجريت دراسات لتحديد أفضل التركيبات التي يمكن استخدامها في تحديد المواقع الثلاثية الترددات، وبعد ذلك في خوارزميات كشف الانزلاق والتصحيح. وتستخدم هذه الخوارزميات كل من قياسات الشفرات والطور، فضلا عن طريقة ثلاثية التردد طورتها ماريا كلارا دي لاسي وزملاؤها. ويتجه القلق بشأن زلات الدورة والعلاقة مع التوقيع الأيونوسفيري في البيانات. في عام 2011، نشرت زيزاو ليو ورقة حول استخدام معدل التغير في إجمالي المحتوى الإلكتروني للكشف عن زلات دورة. من ناحية أخرى، بعد دراسة زلات دورة الغلاف الأيوني، خلص سيمون بانفيل وريتشارد لانغلي في ورقة نشرت في عام 2013 إلى أن زيادة الضوضاء قياس المرتبطة الأيونوسفير النشط يجعل التصحيح دورة زلات تحديا مستمرا، الأمر الذي يتطلب المزيد من التحقيق، في حين شياو هونغ تشانغ و الزملاء، في ورقة نشرت في عام 2014، جاء إلى نفس النتيجة أثناء محاولة إصلاح زلات دورة خلال أحداث التلألؤ. انظر مزيد من القراءة للحصول على قائمة من الأوراق البارزة في تاريخ الكشف عن زلة دورة والتصحيح. كواد-فريكونسي ألغوريثم تستخدم تقنيات الكشف عن الانزلاق في الانزلاق كميات الاختبار (حيث يتم تمثيل انزلاق الدورة بواسطة قفزة أو تغيير كبير في الكمية). وترتبط هذه مع خوارزمية الكشف عن الانقطاع، والتي تهدف إلى تحديد موقع القفزة. كميات الاختبار. وكميات االختبار هي مجموعات خطي ة من الرصدات. وهي تختلف في عدة جوانب: الملاحظات المستخدمة (في حالتنا، قياسات الطور فقط)، وعدد ترددات الموجات الحاملة المستعملة والخصائص الداخلية للخلطة (خالية من الهندسة، خالية من الأيونوسفير ومستوى الضوضاء عند الجمع). في دراستنا، افترضنا قيم الضوضاء على قياسات المرحلة الحاملة غاليليو كما هو مبين في الجدول 1. الجدول 1. الترددات المتاحة في خدمة غاليليو المفتوحة. الثلاثي التردد سيمسكي الجمع. وتستند خوارزمية لدينا أساسا على استغلال تركيبة سيمسكي الثلاثي تردد. وهي عبارة عن تركيبة من الموجة الحاملة الخالية من الهندسة والغلاف الأيوني، بالأمتار، كما هو مبين في المعادلة 2. وعندما تكون هناك أربع ترددات، يمكن حساب أربع تشكيلات ثلاثية الترددات. اثنان منها كافية للكشف عن زلات على أي من الترددات الأربعة. ويجب أن يعتمد اختيار الجمع أولا على دقته (التي يعطيها S في الجدول 2)، ويتم الحصول عليها بتطبيق قانون انتشار التباين - التغاير على ضوضاء القياس الخام (انظر الجدول 1). الدقة ليست العامل الوحيد الذي يجب أخذه بعين الاعتبار عند اختيار التركيبات المناسبة. وفي كل توليفة، تكون ترددات الموجات الحاملة لها تأثيرات مختلفة بسبب أطوال موجاتها المختلفة: فإن تأثير زلة دورة واحدة على تردد E1 لن يكون في الواقع نفس التأثير على E5a أو E5b أو E5ab (انظر الجدول 2). وأصغر تأثير على تركيبة معينة هو دائما أصعب ما يمكن الكشف عنه. الجدول 2. تركيبات سيمسكي. ولذلك، فإن كفاءة مجموعة معينة تعتمد على كل من تأثير أصغر دورة الانزلاق ودقة الجمع (نظرا للانحراف المعياري): كلما زادت النسبة بينهما، وأكثر كفاءة الجمع. ومن بين إمكانيات الجمع الأربع، فإن أعلى النسبتين هما النسبتان اللتان شكلتهما التركيبات E5a-E5b-E5ab و E1-E5a-E5b. وبالتالي فإن هذه هي تلك المستخدمة في خوارزمية لدينا. الجمع بين سيمسكي يسمح لنا للكشف عن إكس وكذلك سس-دم زلات دورة. ومع ذلك، فإن هذا الجمع غير حساس ل زلات سس-سم على جميع الترددات الأربعة (وهي ظاهرة نادرة). ولذلك سيكون لدينا لإضافة كمية اختبار أخرى إلى خوارزمية لدينا. المزدوج التردد، والهندسة خالية من الجمع. وتتيح لنا التكرارات المزدوجة التردد والمزودة بالهندسة، بالأمتار، الكشف عن زلات سس-سم. ويمكن حسابه على النحو التالي: وللأسف، تتأثر تركيبة خالية من الترددات الخالية من الخواص الهندسية بالتأخر الأيونوسفيري. وللتخفيف من الاتجاه السلس الأيونوسفيري، يحسب فارق زمني من الدرجة الرابعة. ومع ذلك، فإن النتيجة تعاني من اختلافات سريعة في التأخر الأيونوسفيري. وعندما تتوفر أربعة ترددات، يمكن حساب ست مجموعات مزدوجة التردد. واحد يكفي للكشف عن وجود زلات دورة في وقت واحد من نفس الحجم. وسيعتمد الاختيار مرة أخرى على النسبة بين دقة التشكيل وأصغر تأثير للزيارات ذات الدورة الواحدة المتزامنة. فمن ناحية، فإن اختلاف نتائج الجمع يؤثر على الدقة. من ناحية أخرى، فإن زلة دورة، وبالتالي أصغر تأثير للكشف، وسيتم تضخيم من قبل اختلاف عالية الترتيب. ويتم الحصول على أفضل نسبة بفارق من الدرجة الرابعة (انظر الجدول 3)، حتى وإن كان قد تم بالفعل إزالة تباين سلس بسبب الأيونوسفير في اختلاف الدرجة الثانية (انظر الشكل 1). الجدول 3. تركيبات خالية من الهندسة. الشكل 1 - تركيبة خالية من الهوة في الوقت: (أ) التشكيل الخام، (ب) فرق الدرجة الأولى؛ (ج) فرق الدرجة الثانية و (د) فرق الترتيب الرابع. حتى لو كانت مجموعة واحدة كافية، نهجنا سوف تستخدم اثنين منهم لمضاعفة التحقق من مخرجاتها: E1-E5a و E1-E5ab، لأنها توفر أفضل النسب. طريقة الكشف. للكشف عن الانقطاع بسبب انزلاق دورة في كمية الاختبار، فمن الضروري إنشاء عتبات الكشف. عتبات هي واحدة من المعلمات الرئيسية في الكشف عن زلة دورة، لأنها تؤدي إلى قرار بشأن وجود زلة دورة أم لا. إذا كانت العتبة تقييدية جدا، يمكن تفويت بعض الزلات الحقيقية (سلبي كاذب). من ناحية أخرى، إذا لم تكن تقييدية بما فيه الكفاية، يمكن الكشف عن الانقطاعات التي لا تتطابق مع زلة دورة بطريقة مسيئة (إيجابية كاذبة). من المهم أن نلاحظ، كما يسلط الضوء على دراستنا، أنه لا يوجد حد الكمال الذي يناسب جميع الاحتياجات والقيود. يجب أن يتم اختيار النظر في تطبيق تحديد المواقع في متناول اليد. قيم العتبة الواردة في هذه المقالة هي تمثيلية وتم تحديدها تجريبيا لتكون الأمثل فيما يتعلق هدفنا للكشف عن الانزلاق دورة تحت النشاط الأيونوسفيري عالية. ويمكن الاطلاع على نتائج ومزيد من المناقشات حول عتبات مختلفة في أطروحة المؤلف الأول (انظر مزيد من القراءة). وسوف تؤثر زلات دورة على تركيبة سيمسكي الخام عن طريق التحول في متوسط ​​قيمة الجمع، في حين أن الوقت تختلف واحد سوف تتأثر ارتفاع. الكشف عن استخدام سيمسكي الجمع. ويجرى الكشف عن انزلاق الدورة على تركيبة سيمسكي ثلاثية التردد في خطوتين متتاليتين (انظر الشكل 2). الشكل 2. طريقة الكشف عن تركيبة سيمسكي. يستخدم الأول تركيبة زمنية مختلفة للكشف عن زلات دورة محتملة باستخدام إطار متوسط ​​متحرك إلى الأمام والخلف بحجم 20 ملاحظة، يتم فيه حساب المعلمات الإحصائية المتوسطة والانحراف المعياري. تتم مقارنة الفترة الحالية مع تلك السابقة للكشف عن ارتفاع، والتي يمكن أن تتوافق مع زلة دورة. ويستخدم نوعان من العتبات: إحصائية (أو نسبية) ومطلقة. كما هو مبين في الشكل 3. باستخدام عتبة الإحصائية يسمح لنا للتكيف مع الكشف عن الجمود من المعلمات الإحصائية. على افتراض الضجيج على الملاحظات (هنا، نتائج مزيج سيمسكي) يتبع التوزيع الطبيعي، فترة الثقة من 3-سيغما حول المتوسط ​​يتضمن 95 في المئة من الملاحظات. وبالنظر إلى نسبة تركيبات سيمسكي اثنين المستخدمة (المحسوبة في وقت سابق)، ونسبة نجاح تصل إلى 100 في المئة لكلا تركيبات، مما يعني أي كس و سس-دم زلات على الكشف عن البيانات بالتأكيد (أي السلبيات كاذبة). ومع ذلك، قد تحدث ايجابيات كاذبة لأن 5 في المئة من البيانات إحصائيا خارج حدود 3-سيغما. الشكل 3. العتبات الإحصائية والمطلقة. ولتقليل هذا المعدل، تطبق أيضا عتبة مطلقة تساوي 0.4 ضعف أصغر تأثير للانزلاق على الاندماج (انظر الجدول 2). وإذا استطعنا أن نأخذ الشكل 3 كمثال مناسب للاضطراب الأيونوسفيري المتطرف الذي يؤدي إلى تقلبات عالية بشكل غير عادي في نتائج الجمع، فإن العتبة المطلقة ستكون في معظم الوقت أعلى بكثير من العتبة الإحصائية وستساعد على خفض معدل عمليات الكشف الخاطئة. وكإخراج من هذه الخطوة الأولى، يتم تعيين قيمة علم إلى عهود ذات قيم أكبر من كلا العتبتين، وبالتالي يمكن أن تتأثر بزلقات الدورة. وبمجرد تحقيق مواقع الزلات المحتملة، فإن الخطوة الثانية تتكون من مقارنة المتوسط ​​قبل وبعد زلات دورة محتملة للحقول المعلنة. يتم تطبيق عتبة مطلقة ثانية، تساوي 0.8 أضعاف التأثير الأصغر. في حالة وجود زلة دورة محتملة أخرى في نافذة الكشف، سيتم تقليل حجم نافذة الكشف لتجنب حساب المعلمات الإحصائية على البيانات التي تم تحويلها جزئيا. الهدف من الخطوة الأولى هو الكشف عن زلات المحتملة. ولذلك، فإن الأولوية هي تجنب فقدان زلة حقيقية مع قيم عتبة منخفضة، مما يؤدي في بعض الأحيان إلى الكشف الإيجابي الكاذب. من ناحية أخرى، تهدف الخطوة الثانية لفصل الايجابيات الكاذبة المحتملة المحتملة المسامير الخارجة في تركيبة الخام من التحولات دورة الانزلاق الحقيقي في المتوسط. والأداء النظري لهذا النهج المكون من خطوتين هو 100 في المائة: لا ينبغي مواجهة أي من الإيجابيات الخاطئة أو السلبيات الكاذبة. الكشف عن استخدام الهندسة الحرة مزيج. وبما أن التركيبة الخالية من الخليط من الدرجة الرابعة تتأثر بتأخر الأيونوسفير المتبقي، لا يمكن تطبيق الإجراء السابق. مثل أي وقت-- ديفيرنسد كمية الاختبار، وسوف تظهر زلة كما ارتفاع في الجمع. لذلك، لا توجد طريقة لتمييز زلات دورة من القيم المتطرفة من خلال مقارنة مستوى متوسط ​​(الخطوة الثانية). وبناء على ذلك، فإن طريقة الكشف تتكون فقط من إطار متوسط ​​متحرك للأمام والخلف، تتم فيه مقارنة فترة الثقة 4-سيغما بالقيمة الحالية للجمع. في الواقع، في هذه الحالة، لا يمكننا تحمل ايجابيات كاذبة على 5 في المئة من الحقبة (الناجمة عن استخدام عتبة 3-سيغما) لأنه لا يمكن وضع خطوة أخرى للقضاء على الايجابيات الكاذبة المتبقية. ومن المتوقع أيضا أن يصل الأداء النظري لطريقة الكشف عن الهندسة إلى 100 في المائة. ومرة أخرى، لا ينبغي مواجهة أي إيجابيات كاذبة أو سلبيات كاذبة. لاحظ أن هذا الحساب يأخذ فقط النسب في الاعتبار، وإهمال حقيقة أن تركيبة خالية من الهندسة هي أيضا حساسة لتغير الأيونوسفير. فاليداتيون لقد قمنا باختبار خوارزمية رباعية التردد على مدى 30 ثانية من عمليات الرصد غاليليو رباعية التردد من المحطات غمسد (في ناكاتان، اليابان) و نكلغ (في ليبرفيل، غابون). استخدمت ملاحظات غسم لاختبار متانة الخوارزمية نحو محاكاة حالات معينة، في حين تم استخدام بيانات نكلغ لتقييم سلوك الخوارزمية للحالات التي تمت تلبيتها في المنطقة الاستوائية. المنهجية. تم إدراج زلات الدورة بشكل مصطنع في بيانات غمسد، مع محاكاة سيناريوهات الانزلاق التالية: إكس، سس-دم و سس-سم. الفائدة من هذا النهج المحاكاة هو أن الناتج خوارزمية يمكن بسهولة أن تقارن إلى الحل المعروف بالفعل. وعلاوة على ذلك، استخدمت هذه البيانات لتحديد ما إذا كان استخدام المزيد من ترددات الموجات الحاملة يمكن أن يزيد من أداء كشف انزلاق الدورة. قمنا بتحليل مجموعة بيانات نكلغ لمدة 50 يوما، والتي تغطي الملاحظات من 6 يناير إلى 1 فبراير، ومن 24 يونيو إلى 19 يوليو 2014. وتتكون هذه العينة من مختلف الدول الأيونوسفيرية: أيام الهدوء والمتطرفة، وكذلك النشاط الاستوائي النموذجي . منذ ذروة دورة الشمسية حدث في عام 2014، والبيانات من ذلك العام يناسب تماما دراسة لآثار النشاط الأيونوسفيري عالية. استخدمنا البيانات الخام نكلج لتحقيق هدف مزدوج. أولا، أردنا أن نحدد نسبة العهود التي لا يمكن تمييز زلات دورة صغيرة (دورة واحدة أو اثنين أو خمس دورات). وقد تم ذلك من خلال مقارنة تأثير (بالأمتار) من هذه السيناريوهات إلى العتبة اللحظية المرتبطة بكل عصر. وفي حالة ارتفاع عتبة الكشف عن الانزلاق، لا يمكن الكشف عن زلات حالية من دورة أو اثنتين أو خمس دورات. وجزء من العصور في يوم لم يتم الكشف عن مثل هذه زلات دورة صغيرة، لكل تركيبة المستخدمة في الخوارزمية، ويبدو أن مؤشر مناسب لفعالية الخوارزمية في المنطقة الاستوائية. ثانيا، قمنا بتحليل النتائج من خلال تقييم بصريا الناتج الخوارزمية باستخدام الرسومات الجمع، وحاول الإجابة على الأسئلة التالية: هل يبدو أن العصور التي تتأثر بها زلات دورة هل هناك زلات دورة الفعلية التي لا تزال النتائج غير المكتشفة. وقد بحثنا عن كثب نتائج عمليات المحاكاة وتحليل البيانات الأولية. محاكاة حالات خاصة. وبالمقارنة مع الأساليب المزدوجة والتردد الثلاثي المكافئة، أعطت خوارزمية رباعية التردد الجديدة نتائج أفضل: تم اكتشاف جميع زلات الدورة المدرجة بنجاح ولم تلاحظ أية تأثيرات كاذبة. نكلغ تحليل مجموعة البيانات الخام. عملية التحقق من صحة باستخدام البيانات الخام نكلغ يسلط الضوء على العديد من الاتجاهات في نتائج الخوارزمية. أولا وقبل كل شيء، من المثير للاهتمام أن نلاحظ أن الكشف عن زلات معزولة وكذلك زلات من حجم مختلف (باستخدام تركيبات سيمسكي) كان مضمونا لكل فترة الملاحظة من كل يوم تحليلها. في الواقع، عتبات سيمسكي لحظية لم يتجاوز أبدا تأثير زلة من اتساع دورة واحدة. وبالإضافة إلى ذلك، في 25 في المئة من أيام تحليلها، ويمكن أيضا الكشف عن زلات دورة من نفس الحجم مضمونة. وبالنسبة للأيام المتبقية، لا يمكن ضمان الكشف عن زلات الدورة المتزامنة التي تكون اتساعاتها أقل من خمس دورات لعدد قليل من فترات المراقبة، والتي يمكن إهمالها بشكل معقول بسبب الاحتمال الضئيل جدا في مواجهة مثل هذه الحالات الاستثنائية. ويرجع ذلك إلى تأثير التباين الأيونوسفيري على تركيبة خالية من الهندسة، مما أدى إلى قيم عتبة عالية لحظية. ومع ذلك، فإن كل من سيمسكي والهندسة خالية من مجموعات تعاني من الكشف الإيجابي الكاذب في ظل الأحداث الأيونوسفيرية المتطرفة: إذا تم الكشف عن زلة دورة، فإنه في بعض الأحيان يتوافق مع الخارج. ويعزى هذا التأثير الجانبي إلى خيارات العتبة التي قطعناها على أنفسنا لتتناسب مع هدفنا الأولي المتمثل في الكشف عن جميع زلات الدورة على وجه اليقين، بدلا من المخاطرة بخسارة أحدهم، حتى ولو كانت الإيجابيات الخاطئة جزءا من قائمة النتائج. مزيد من التحسينات بالإضافة إلى تطبيقات ما بعد المعالجة، قمنا أيضا بالنظر في التكيف في الوقت الحقيقي من الخوارزمية. القيد في الوقت الحقيقي يؤثر على كل من سيمسكي وأساليب الكشف خالية من الهندسة. في هذا التكوين، يمكن للنافذة الإحصائية أن تتحرك إلى الأمام فقط، الأمر الذي يهمل الكشف عن زلة الدورة في العشرين سنة الأولى. وعلاوة على ذلك، لم يعد من الممكن النظر في متوسط ​​مستوى المقارنة (انظر طريقة الكشف سيمسكي الموصوفة سابقا) لأن المتوسط ​​التالي للانزلاق دورة محتملة لا يمكن أن يحسب في الوقت الحقيقي المعالجة. حتى إذا كانت خوارزمية الكشف رباعية التردد تعاني من القيود في الوقت الحقيقي، فإنه لا يزال يثبت كفاءة إذا أخذت هذه الأخيرة في الاعتبار لعتبات مناسبة الخيارات. الكشف عن زلة دورة هو في الواقع سوى خطوة أولى، وينبغي تصحيح الانزلاق دورة استكمال الإجراء لتجنب الانقطاعات. ومع ذلك، تجدر الإشارة إلى أن مجرد إدراك وجود زلة دورة في مجموعة بيانات هي معلومات ثمينة للمستخدم، وفي الفترة المقابلة، قد تكون المعلمات في رينيتياليزد. وقد تم دمج خوارزمياتنا بطريقة مباشرة مع جهاز استقبال البرامج، مما مكن من توفير بيانات مستمرة وتصحيحية للمستخدم. الخلاصة في هذه المقالة، أدخلنا أول خوارزمية الكشف عن زلة دورة رباعية التردد، مع الكفاءة التي هي بوضوح خطوة إلى الأمام. تفتح طريقة الكشف المبتكرة هذه أبواب جديدة للعديد من التطبيقات البحثية والتجارية. وسيكون بمقدور كل مستخدم من مستخدمي غاليليو، سواء كان مدنيا أم عسكريا، أن يستفيد من وضع أفضل للجودة، لا سيما في ظروف الغلاف الأيوني القاسية: ليس فقط حيث تكون الأيونوسفير لا تهدأ بوجه خاص كما هو الحال في المناطق الاستوائية والقطبية، ولكن أيضا عند أي خط عرض خلال فترة اضطراب الأيونوسفيرية. وفيما يتعلق بتحديد المواقع بدقة، تعد هذه خطوة أخرى تعزز قدرة غاليليوس على المنافسة ضد الأنظمة المزدوجة أو الثلاثية التردد. شكر وتقدير تستند هذه المقالة إلى ورقة الكشف عن زلات دورة في وضع رباعية التردد: غاليليوس المساهمة في نهج فعال في إطار النشاط الأيونوسفيري عالية، وتقديم الفائزة لمسابقة الطلاب 20142015 من لجنة الاتصال غومتريس يوروبنز في غاليليو، إغنوس، كوبرنيكوس "، التي ترعاها الوكالة العالمية للملاحة الفضائية، وهي الوكالة الأوروبية العالمية لأنظمة سواتل الملاحة. تلقت لورا فان دي فيفير شهادة ماجستير. في علم الجيولوجيا وعلم الهندسة من جامعة دي ليج، بلجيكا، في عام 2015. وقد كرس أطروحة الماجستير ل غاليليو كشف الانزلاق دورة تحت النشاط الأيونوسفيري المتطرفة. وفي عام 2015، انضمت إلى M3 سيستمز بلجيوم في وافر كمهندس مشروع الملاحة الراديوية، وتشارك حاليا في مشاريع القياس العاكس للنظام العالمي للملاحة بالأقمار الصناعية ومشاريع التهجين التابعة للنظام العالمي للملاحة بالأقمار الصناعية. تلقى رن وارنت شهادة ماجستير. في الفيزياء في عام 1988 ودكتوراه. في الفيزياء مع تخصص في النظم العالمية لسواتل الملاحة في عام 1996، وكلاهما من جامعة كاثوليك دي لوفان، لوفان-لا-نيوف، بلجيكا. بدأ حياته المهنية كموظف جيوديسي في المرصد الملكي لبلجيكا في عام 1988. ومنذ يونيو 2011، وهو أستاذ بدوام كامل ورئيس مختبر الجيوديسي و غنس في جامعة ليج حيث هو المسؤول عن التعليم في مجال والجيوديسيا الفضائية، والنظام العالمي للملاحة بالأقمار الصناعية. قراءة المزيد المؤلفون الأولون الأطروحة وورقة الحائز على جائزة دتكتيون ديس سوتس دي سيكليس إن مود مولتي-فركانس بور لي سيستم غاليليو بي L. فان دي فيفير، مموير (ثيسيس) فور ذي ماستر إن سسينسس غوغرافيكش أورينتاتيون غوماتيك أند غومترولوجي، ونيفرزيت دي ليج، بلجيكا، يونيو 2015. الكشف عن زلات دورة في وضع رباعية التردد: غاليليوس المساهمة في نهج فعال تحت النشاط الأيونوسفيري عالية من قبل L. فان دي فيفير، وتقديم الفائزة لمسابقة الطلاب 20142015 من لجنة الاتصال غومترس يوروبنز في غاليليو ، إغنوس، كوبرنيكوس الفئة، التي ترعاها غسا، الوكالة العالمية لسواتل الملاحة العالمية. بعض الأعمال السابقة على الكشف عن زلة دورة وإصلاح طريقة فعالة لتكرار التردد المزدوج وثلاثية ل غاليليو وإشارات غس من قبل M. لونشاي، B. بيدين و R. وارنانت، في وقائع الندوة الدولية الثالثة على الجوانب العلمية والاساسية من برنامج غاليليو. كوبنهاغن، الدانمرك، 31 أغسطس 2 سبتمبر 2011. وهناك طريقة جديدة للكشف عن دورة الانزلاق الآلي وإصلاح جهاز استقبال غس ثنائي التردد واحد بواسطة Z. ليو في مجلة الجيوديسيا. المجلد. 85، No.3، مارش 2011، ب. 171183، دوي: 0.1007s00190-010-0426-y. الفورية في الوقت الحقيقي الانزلاق دورة الانزلاق من بيانات غس ثنائي التردد من قبل D. كيم و R. لانغلي في وقائع كيس 2001. ، الندوة الدولية حول النظم الكينماتيكية في الجيوديسيا، جيوماتكس والملاحة، بانف، ألبرتا، 58 يونيو 2001، ص 255264. خوارزمية التحرير الآلي للبيانات غس من قبل G. بليويت في رسائل البحوث الجيوفيزيائية. المجلد. 17، No.3، مارش 1990، ب. 199202، دوي: 10.1029GL017i003p00199. تحسين تحديد المواقع الدقيقة في وجود التلألؤ الأيونوسفيري بواسطة X. تشانغ و F. غو و P. زو في حلول غس. المجلد. 18، No.1، Jan. 2014، ب. 5160، دوي: 10.1007s10291-012-0309-1. كشف زلة دورة وإصلاح لمالحظات غس غير مكتسبة تحت النشاط الأيونوسفيري عالية من قبل C. كاي، Z. ليو، P. شيا و W. داي في حلول غس. المجلد. 17، No.2، أبريل 2013، ب. 247260، دوي: 10.1007s10291-012-0275-7. التخفيف من تأثير زلات الدورة الأيونوسفيرية في ملاحظات الشبكة العالمية لسواتل الملاحة من قبل S. بانفيل و R. B. لانغلي في مجلة الجيوديسيا. المجلد. 87، No.2، Feb. 2013، ب. 179193، دوي: 10.1007s00190-012-0604-1. الكشف في الوقت الحقيقي وإصلاح زلات دورة في غنس الثلاثي التردد قياسات Q. زاو، B. الشمس، Z. داي، Z. هو، C. شي و J. ليو في حلول غس. المجلد. 19، No.3، جولاي 2015، ب. 381391، دوي: 10.1007s10291-014-0396-2. في الوقت الحقيقي الكشف عن الانزلاق دورة في الثلاثي التردد غنس بواسطة M. C. دي لاسي، M. ريجوزوني و F. سانس في حلول غس. المجلد. 16، No. 3، جولاي 2012، ب. 353362، دوي: 10.1007s10291-011-0237-5. شارك هذا: تاواني - هم ليسوا جميعا في عداد المفقودين هذه النقطة. ما تقوله يحتاج إلى تعريف باستخدام مصطلحات عامة. لا يمكنك الذهاب مع مثال واحد. دون تعريفات عامة، إذا كان 400 هو 30 هو لا يزال خارجا وإذا كان 14 و 9 أين تتوقف تحتاج stddev39s، نطاقات، الرباعي، للقيام بذلك. نداش دانيال داراناس فبراير 09 09 في 17:05 في تقليم كنت don39t إزالة القيم المتطرفة كنت مجرد don39t تضمينها في الحساب. قد تشير كيريموفيكوت أن النقاط لم تعد في مجموعة البيانات. وأنت لا تزيل (أو تتجاهلها) لأنها متطرفة المعيار هو (عادة) فقط أنها في بعض جزء كبير من البيانات. والقيمة غير المدرجة في المتوسط ​​المشذب غالبا ما تكون أكثر قليلا (أو أقل) من أعلى (أدنى) قيمة متضمنة. نداش نيك كوكس ديك 3 14 في 16:48 أنا لا أعرف إذا كان لديه اسم، ولكن هل يمكن أن تأتي بسهولة مع عدد من الخوارزميات لرفض القيم المتطرفة: البحث عن الأرقام بين النسب المئوية 10 و 90 (القيام بذلك عن طريق الفرز ثم رفض أول N10 والأرقام N10 الأخيرة) وتأخذ القيمة المتوسطة للقيم المتبقية. Sort values, reject high and low values as long as by doing so, the meanstandard deviation change more than X. Sort values, reject high and low values as long as by doing so, the values in question are more than K standard deviations from the mean. The most common way of having a Robust (the usual word meaning resistant to bad data) average is to use the median . This is just the middle value in the sorted list (of half way between the middle two values), so for your example it would be 90.5 half way between 90 and 91. If you want to get really into robust statistics (such as robust estimates of standard deviation etc) I would recommend a lost of the code at The AGORAS group but this may be too advanced for your purposes. answered Feb 13 09 at 9:22 If all you have is one variable (as you imply) I think some of the respondents above are being over critical of your approach. Certainly other methods that look at things like leverage are more statistically sound however that implies you are doing modeling of some sort. If you just have for example scores on a test or age of senior citizens (plausible cases of your example) I think it is practical and reasonable to be suspicious of the outlier you bring up. You could look at the overall mean and the trimmed mean and see how much it changes, but that will be a function of your sample size and the deviation from the mean for your outliers. With egregious outliers like that, you would certainly want to look into te data generating process to figure out why thats the case. Is it a data entry or administrative fluke If so and it is likely unrelated to actual true value (that is unobserved) it seems to me perfectly fine to trim. If it is a true value as far as you can tell you may not be able to remove unless you are explicit in your analysis about it. answered Dec 3 14 at 13:58 My statistics textbook refers to this as a Sample Mean as opposed to a Population Mean. Sample implies there was a restriction applied to the full dataset, though no modification (removal) to the dataset was made. answered Mar 26 16 at 3:13 0. Welcome to the site. 1. Which book Please give a reference. 2. quotSample meanquot does not typically refer to a mean obtained after removing outliers. ndash Juho Kokkala Mar 26 16 at 8:06 It can be the median. ليس دائما، ولكن أحيانا. I have no idea what it is called in other occasions. Hope this helped. (At least a little.)I am working with a large amount of time series. وهذه المسلسلات الزمنية هي أساسا قياسات الشبكة قادمة كل 10 دقائق، وبعضها دوري (أي عرض النطاق الترددي)، في حين أن بعض المداخل الأخرى (أي مقدار حركة التوجيه). أود خوارزمية بسيطة للقيام الكشف خارج الإنترنت. في الأساس، أريد أن أبقى في الذاكرة (أو على القرص) البيانات التاريخية كلها لكل سلسلة زمنية، وأريد أن الكشف عن أي خارج في سيناريو الحية (في كل مرة يتم التقاط عينة جديدة). ما هي أفضل طريقة لتحقيق هذه النتائج إم حاليا باستخدام المتوسط ​​المتحرك من أجل إزالة بعض الضوضاء، ولكن بعد ذلك ما بعد الأشياء البسيطة مثل الانحراف المعياري، جنون. ضد مجموعة البيانات كلها لا تعمل بشكل جيد (لا أستطيع أن نفترض أن سلسلة زمنية ثابتة)، وأود أن شيئا أكثر دقة، من الناحية المثالية مربع أسود مثل: ضعف أوتليرديتكتيون (ناقلات مزدوجة، قيمة مزدوجة) حيث ناقلات هو مجموعة من تحتوي على مزدوجة والبيانات التاريخية، وقيمة الإرجاع هي النتيجة الشاذة لقيمة العينة الجديدة. طلب أغسطس 2 10 في 20:37 نعم، لقد افترضت تردد معروف ومحدد. هناك طرق لتقدير التردد تلقائيا، ولكن من شأنها أن تعقد وظيفة إلى حد كبير. إذا كنت بحاجة لتقدير التردد، حاول طرح سؤال منفصل حول ذلك - و I39ll ربما تقديم إجابة ولكن يحتاج مساحة أكبر مما أتيحت في تعليق. نداش روب هيندمان أوج 3 10 في 23:40 وهناك حل جيد لديها العديد من المكونات، بما في ذلك: استخدام مقاومة، والانتقال نافذة على نحو سلس لإزالة نونستاتيوناريتي. إعادة التعبير عن البيانات الأصلية بحيث البقايا فيما يتعلق بسلاسة وتوزيعها بشكل متناظر تقريبا. نظرا لطبيعة البيانات الخاصة بك، من المرجح أن جذورها مربع أو اللوغاريتمات تعطي مخلفات متماثلة. تطبيق أساليب التحكم في الرسم البياني، أو على الأقل مراقبة تخطيط التفكير، إلى بقايا. بقدر ما يذهب آخر واحد، ويظهر الرسم البياني مراقبة الرسم البياني أن العتبات التقليدية مثل 2 سد أو 1.5 أضعاف إقر وراء الربعين تعمل بشكل سيء لأنها تؤدي الكثير من إشارات كاذبة خارج عن السيطرة. الناس عادة استخدام 3 سد في العمل الرسم البياني السيطرة، من حيث 2.5 (أو حتى 3) مرات إقر وراء الرباعي سيكون نقطة انطلاق جيدة. لقد أوضحت بشكل أو بآخر طبيعة حل روب هيندمانز في حين أضفت إليها نقطتين رئيسيتين: الحاجة المحتملة إلى إعادة التعبير عن البيانات والحكمة من كونها أكثر تحفظا في الإشارة إلى أن من الخارج. أنا لست متأكدا من أن لوس هو جيد للكشف عن الانترنت، على الرغم من ذلك لأنه لا يعمل بشكل جيد في النهاية. يمكنك بدلا من ذلك استخدام شيء بسيط مثل مرشح الوسيط المتحرك (كما هو الحال في توكيس مقاومة التمهيد). إذا لم تأتي القيم المتطرفة في رشقات نارية، يمكنك استخدام نافذة ضيقة (5 نقاط البيانات، ربما، والتي سوف تنهار فقط مع انفجار من 3 أو أكثر القيم المتطرفة ضمن مجموعة من 5). مرة واحدة كنت قد أجريت التحليل لتحديد جيد إعادة التعبير عن البيانات، من غير المرجح أن تحتاج إلى تغيير إعادة التعبير. لذلك، كاشف الانترنت الخاص بك حقا يحتاج فقط إلى الرجوع إلى أحدث القيم (أحدث نافذة) لأنه لن تستخدم البيانات السابقة على الإطلاق. إذا كان لديك سلسلة زمنية طويلة حقا يمكن أن تذهب أبعد من ذلك لتحليل الارتباط الذاتي والموسمية (مثل التقلبات اليومية أو الأسبوعية المتكررة) لتحسين الإجراء. أجاب 26 أغسطس 10 في 18:02 جون، 1.5 إقر هو Tukey39s التوصية الأصلية لأطول شعيرات على بوكسبلوت و 3 إقر هو توصيته لنقاط بمناسبة كما كوتار أوتيرلزكوت (حثالة على عبارة 6039s شعبية). هذا هو في صلب العديد من خوارزميات بوكسبلوت. تم تحليل التوصية نظريا في هواجلين، موستيلر، أمب توكي، فهم تحليل البيانات القوية والاستكشافية. نداش w هيوبر 9830 أوكت 9 12 في 21:38 هذا يؤكد البيانات سلسلة زمنية كنت أحاول تحليل. متوسط ​​النافذة وأيضا انحرافات نافذة قياسية. ((x - أفغ) سد) غ 3 يبدو أن النقاط التي أريد أن أعلم كما المتطرفين. حسنا على الأقل تحذير كما أوتلييرز، وأنا أعلم أي شيء أعلى من 10 سد كما المتطرفين الخطأ المتطرفة. المشكلة التي واجهت هو ما هو مثالي طول نافذة I39m اللعب مع أي شيء بين 4-8 نقاط البيانات. نداش نيوزينيث 29 يونيو 16 في 08:00 الجدد قد يكون أفضل رهان لتجربة مع مجموعة فرعية من البيانات الخاصة بك وتأكيد استنتاجاتك مع اختبارات على ما تبقى. يمكنك إجراء عملية التحقق من صحة أكثر رسمية، أيضا (ولكن هناك حاجة إلى رعاية خاصة مع البيانات سلسلة زمنية بسبب الترابط بين جميع القيم). نداش w هوبر 9830 جون 29 16 في 12:10 (ردت هذه الإجابة على سؤال مكررة (مغلق الآن) في الكشف عن الأحداث المعلقة التي قدمت بعض البيانات في شكل رسوم بيانية). الكشف الخارجي يعتمد على طبيعة البيانات وعلى ما على استعداد لتحمل عنها. وتعتمد الطرق العامة الغرض على إحصاءات قوية. روح هذا النهج هو وصف الجزء الأكبر من البيانات بطريقة لا تتأثر أي القيم المتطرفة ومن ثم نشير إلى أي القيم الفردية التي لا تناسب هذا التوصيف. لأن هذا هو سلسلة زمنية، فإنه يضيف تعقيد الحاجة إلى (إعادة) الكشف عن القيم المتطرفة على أساس مستمر. إذا كان هذا هو أن يتم ذلك كما تتكشف سلسلة، ثم يسمح لنا فقط لاستخدام البيانات القديمة للكشف، وليس البيانات في المستقبل وعلاوة على ذلك، كحماية ضد العديد من الاختبارات المتكررة، ونحن نريد أن استخدام أسلوب يحتوي على كاذبة منخفضة جدا إيجابي. هذه الاعتبارات تشير إلى تشغيل بسيطة، قوية تتحرك نافذة اختبار خارجي على البيانات. هناك العديد من الاحتمالات، ولكن واحدة بسيطة، من السهل فهمها وسهولة تنفيذها واحد يقوم على تشغيل ماد: متوسط ​​الانحراف المطلق عن الوسيط. ويعد هذا مقياسا قويا قويا للتغير داخل البيانات، وهو ما يشبه الانحراف المعياري. وستكون الذروة البعيدة عدة مدارات أو أكثر من المتوسط. لا يزال هناك بعض الضبط الذي يتعين القيام به. كم من الانحراف عن الجزء الأكبر من البيانات ينبغي أن تعتبر نائية، وإلى أي مدى مرة أخرى في الوقت المناسب ينبغي أن ننظر واحد يتيح ترك هذه كمعلمات للتجريب. تطبيق هيريس R على البيانات x (1،2، لدوتس، n) (مع n1150 لمحاكاة البيانات) مع القيم المقابلة y: تطبق على مجموعة البيانات مثل المنحنى الأحمر موضح في السؤال، وتنتج هذه النتيجة: البيانات مبينة باللون الأحمر، ونافذة 30 يوما من العتبات الوسطية 5 رمادية، والقيم المتطرفة - التي هي ببساطة تلك القيم للبيانات فوق المنحنى الرمادي - باللون الأسود. (لا يمكن حساب العتبة إلا في نهاية النافذة الأولية، وبالنسبة لجميع البيانات الموجودة في هذه النافذة الأولية، تستخدم العتبة الأولى: هذا هو السبب في أن المنحنى الرمادي مسطح بين x0 و x30.) إن آثار تغيير المعلمات هي (أ) زيادة قيمة النافذة سوف تميل إلى تمهيد المنحنى الرمادي و (ب) زيادة عتبة رفع المنحنى الرمادي. ومع ذلك، يمكن للمرء أن يأخذ شريحة أولية من البيانات وتحديد بسرعة المعلمات من المعلمات التي تفصل أفضل القمم البعيدة من بقية البيانات. تطبيق قيم المعلمات هذه للتحقق من بقية البيانات. إذا أظهرت المؤامرة الطريقة تزداد سوءا مع مرور الوقت، وهذا يعني أن طبيعة البيانات تتغير وقد تحتاج المعلمات إلى إعادة ضبط. لاحظ كيف القليل هذا الأسلوب يفترض حول البيانات: أنها لا تحتاج إلى أن توزع عادة أنها لا تحتاج إلى عرض أي دورية أنها لا تحتاج حتى أن تكون غير سلبية. كل ما يفترض هو أن البيانات تتصرف بطريقة مماثلة إلى حد كبير على مر الزمن وأن القمم النائية هي أعلى بشكل واضح من بقية البيانات. إذا كان أي شخص يرغب في تجربة (أو مقارنة بعض الحلول الأخرى إلى واحد عرضت هنا)، وهنا هو رمز كنت تستخدم لإنتاج البيانات مثل تلك المعروضة في السؤال. أنا التخمين متطورة نموذج سلسلة الوقت لن تعمل بالنسبة لك بسبب الوقت الذي يستغرقه للكشف عن القيم المتطرفة باستخدام هذه المنهجية. لذلك، هنا هو الحل: أولا إنشاء خط الأساس أنماط المرور العادية لمدة سنة على أساس التحليل اليدوي للبيانات التاريخية التي تمثل الوقت من اليوم، أيام الأسبوع مقابل عطلة نهاية الأسبوع، شهر من السنة الخ استخدام هذا خط الأساس جنبا إلى جنب مع بعض آلية بسيطة (مثل المتوسط ​​المتحرك الذي اقترحه كارلوس) للكشف عن القيم المتطرفة. قد ترغب أيضا في مراجعة الأدب الإحصائي لمراقبة العملية لبعض الأفكار. نعم، هذا هو بالضبط ما أقوم به: حتى الآن أنا يدويا تقسيم إشارة إلى فترات، بحيث لكل واحد منهم يمكن أن تحدد فترة الثقة التي من المفترض أن تكون إشارة ثابتة، وبالتالي يمكنني استخدام أساليب قياسية مثل كما الانحراف المعياري. المشكلة الحقيقية هي أنني لا يمكن أن تقرر النمط المتوقع لجميع الإشارات يجب أن تحليل، وهذا 39s لماذا I39m تبحث عن شيء أكثر ذكاء. نداش جانلوكا 2 أغسطس 10 في 21:37 هنا هو فكرة واحدة: الخطوة 1: تنفيذ وتقدير نموذج سلسلة زمنية عامة على أساس مرة واحدة استنادا إلى البيانات التاريخية. ويمكن القيام بذلك حاليا. الخطوة 2: استخدام النموذج الناتج للكشف عن القيم المتطرفة. الخطوة 3: في بعض الترددات (ربما كل شهر)، إعادة معايرة نموذج السلاسل الزمنية (وهذا يمكن القيام به حاليا) بحيث كشف الخطوة 2 من القيم المتطرفة لا يذهب كثيرا من خطوة مع أنماط حركة المرور الحالية. هل هذا العمل لسياقك نداش user28 2 أغسطس 10 في 22:24 نعم، قد يعمل هذا. كنت أفكر في نهج مماثل (إعادة حساب خط الأساس كل أسبوع، والتي يمكن أن تكون وحدة المعالجة المركزية مكثفة إذا كان لديك مئات من المتسلسلة الزمنية أحادية المتغيرات لتحليل). راجع للشغل السؤال الصعب الحقيقي هو كووات هو أفضل خوارزمية على غرار الاسود على غرار النمذجة إشارة عامة تماما، النظر في الضوضاء، وتقدير الاتجاه والموسمية. عفيك، كل نهج في الأدب يتطلب مرحلة صعبة حقا تونينكوت كوتاراميتر، والطريقة الوحيدة التي وجدت التلقائي هو نموذج أريما من قبل هيندمان (روجيندمانزوفتوفوريكاست). أنا في عداد المفقودين شيء نداش جانلوكا 2 أغسطس 10 في 22:38 مرة أخرى، وهذا يعمل بشكل جيد إذا كان من المفترض أن يكون إشارة موسمية من هذا القبيل، ولكن إذا كنت تستخدم سلسلة زمنية مختلفة تماما (أي متوسط ​​تكب ذهابا وإيابا الوقت مع مرور الوقت )، لن تعمل هذه الطريقة (لأنه سيكون من الأفضل التعامل مع ذلك مع المتوسط ​​العالمي البسيط والانحراف المعياري باستخدام نافذة منزلقة تحتوي على بيانات تاريخية). نداش جانلوكا 2 أغسطس 10 في 22:02 إلا إذا كنت على استعداد لتنفيذ نموذج سلسلة الوقت العام (الذي يجلب في سلبياتها من حيث الكمون الخ) أنا متشائم أنك سوف تجد التنفيذ العام الذي في نفس الوقت هو بسيط بما فيه الكفاية للعمل لجميع أنواع السلاسل الزمنية. نداش user28 أوج 2 10 في 22:06 تعليق آخر: أنا أعرف أن إجابة جيدة قد يكون أيضا يمكنك تقدير دورية للإشارة، وتقرر الخوارزمية لاستخدامها وفقا ل إيتكوت، ولكن أنا didn39t العثور على حل جيد حقيقي لهذا الآخر (لعبت قليلا مع التحليل الطيفي باستخدام دفت وتحليل الوقت باستخدام وظيفة الارتباط الذاتي، ولكن بلدي سلسلة زمنية تحتوي على الكثير من الضوضاء وهذه الأساليب تعطي بعض النتائج مجنون معظم الوقت) نداش جانلوكا 2 أغسطس 10 في 22:06 A التعليق على التعليق الأخير الخاص بك: that39s لماذا I39m تبحث عن نهج أكثر عمومية، ولكن أنا بحاجة إلى نوع من بوكبلاك كوتكوت لأنني يمكن 39t جعل أي افتراض حول إشارة تحليلها، وبالتالي أنا يمكن 39t إنشاء مجموعة معلمات كوبيست لخوارزمية التعلم. نداش جانلوكا 2 أغسطس 10 في 22:09 لأنه هو سلسلة البيانات الزمنية، مرشح الأسي بسيط en. wikipedia. orgwikiEononsmsmoothing سوف تبسيط البيانات. وهو مرشح جيد جدا منذ كنت لا تحتاج إلى تجميع نقاط البيانات القديمة. مقارنة كل قيمة البيانات تمهيد حديثا مع قيمة أونسموثيد لها. مرة واحدة يتجاوز الانحراف عتبة محددة مسبقا محددة (اعتمادا على ما كنت تعتقد أن أوتلير في البيانات الخاصة بك هو)، ثم الخاص بك خارج يمكن الكشف بسهولة. أجاب 30 أبر 15 في 8:50 هل يمكن استخدام الانحراف المعياري للقياسات N الماضية (لديك لاختيار N مناسبة). وتكون النتيجة الشاذة الجيدة هي عدد الانحرافات المعيارية التي يتم قياسها من المتوسط ​​المتحرك. أجاب 2 أغسطس في 20:48 شكرا لكم على ردكم، ولكن ماذا لو كانت إشارة يحمل موسمية عالية (أي الكثير من القياسات شبكة تتميز بنمط يومي وأسبوعي في نفس الوقت، على سبيل المثال ليلة مقابل يوم أو عطلة نهاية الأسبوع مقابل أيام العمل) لن يعمل نهج قائم على الانحراف المعياري في هذه الحالة. نداش جانلوكا 2 أغسطس 10 في 20:57 على سبيل المثال، إذا حصلت على عينة جديدة كل 10 دقيقة، و I39m القيام كشف خارج النطاق من استخدام النطاق الترددي للشبكة من الشركة، وأساسا في 06:00 هذا التدبير سوف تسقط (وهذا هو المتوقع نمط عادي تماما)، وسوف يفشل الانحراف المعياري محسوبة على نافذة انزلاق (لأنه سيؤدي إلى تنبيه على وجه اليقين). في الوقت نفسه، إذا انخفض التدبير في 4:00 (الانحراف عن خط الأساس المعتاد)، وهذا هو أوتلير الحقيقي. نداش جانلوكا 2 أغسطس 10 في 20:58 ما أقوم به هو مجموعة القياسات حسب الساعة واليوم من الأسبوع ومقارنة الانحرافات القياسية من ذلك. لا يزال لا تصحيح لأشياء مثل العطلات والموسمية الصيفية ولكن الصحيح معظم الوقت. الجانب السلبي هو أنك حقا بحاجة لجمع سنة أو نحو ذلك من البيانات لديك ما يكفي بحيث ستديف يبدأ المنطق. ويكتشف التحليل الطيفي التواتر الدوري في السلاسل الزمنية الثابتة. نهج النطاق الترددي القائم على تقدير الكثافة الطيفية هو النهج الذي أوصي به كخطوة أولى. إذا كان عدم انتظام فترات معينة يعني ذروة أعلى بكثير مما هو نموذجي لتلك الفترة، فإن السلسلة مع مثل هذه المخالفات لن تكون ثابتة وأن الانزياح الطيفي لن يكون مناسبا. ولكن على افتراض أنك قد حددت الفترة التي لديها مخالفات يجب أن تكون قادرة على تحديد ما يقرب من ارتفاع الذروة العادية سيكون ثم يمكن تعيين عتبة على مستوى ما فوق هذا المتوسط ​​لتعيين الحالات غير النظامية. أجاب سيب 3 12 في 14:59 أقترح المخطط أدناه، والتي ينبغي أن تكون قابلة للتطبيق في يوم أو نحو ذلك: جمع العديد من العينات كما يمكنك الاحتفاظ في الذاكرة إزالة القيم المتطرفة واضحة باستخدام الانحراف المعياري لكل سمة حساب وتخزين مصفوفة الارتباط وكذلك متوسط ​​كل سمة حساب وتخزين المسافات محالانوبيس من كل ما تبذلونه من العينات حساب البذلة: لعينة واحدة التي تريد أن تعرف لها البخاري: استرداد الوسائل، مصفوفة التباين و ماهالانوبيس المسافة ق من التدريب حساب المسافة ماهالانوبيس د لعينتك إرجاع النسبة المئوية التي d يسقط (باستخدام مسافات ماهالانوبيس من التدريب) التي ستكون النتيجة أوتلير الخاص بك: 100 هو خارج المتطرفة المتطرفة. PS. في حساب المسافة ماهالانوبيس. استخدام مصفوفة الارتباط، وليس مصفوفة التباين المشترك. هذا هو أكثر قوة إذا كانت قياسات العينة تختلف في وحدة ورقم.

No comments:

Post a Comment