Twoje pytanie porusza bardzo wiele kwestii, dlatego postaram się udzielić odpowiedzi na każdy z poruszonych przez Ciebie problemów. Aby jasno sformułować niektóre z tych kwestii, należy na początku zauważyć, że wartość p jest ciągłą miarą dowodu przeciwko hipotezie zerowej (na korzyść podanej alternatywy), ale kiedy porównajcie to z określonym poziomem istotności, aby wyciągnąć wniosek o „istotności statystycznej”, dychotomizujemy tę ciągłą miarę dowodów na miarę binarną .
Nie ma sensu mówić ludziom, że wynik nie jest znaczący w próbie 71, ale jest znaczący w próbie 77.
Musisz zdecydować, która z tych dwóch jest w rzeczywistości odpowiednią próbką - tj. czy należy usunąć sześć punktów danych z danych. Z powodów wielokrotnie wyjaśnianych na tej stronie (np. tutaj i tutaj) złym pomysłem jest usuwanie „wartości odstających”, które nie są spowodowane nieprawidłowym zapisem obserwacji. Tak więc, jeśli nie masz powodu, aby sądzić, że tak jest, prawdopodobnie należy użyć wszystkich 77 punktów danych. W takim przypadku nie ma sensu mówić nic o wyselekcjonowanej podpróbce 71 danych punktów.
Zauważ, że problem nie ma nic wspólnego z kwestią istotności statystycznej. To ma sens, że wyniki różnych testów hipotez (np. Tego samego testu na różnych danych) mogą się różnić, więc nie ma powodu, aby uważać to za problematyczne, że w jednym przypadku istniałyby istotne statystycznie dowody na alternatywną hipotezę, ale nie w drugim. Jest to naturalna konsekwencja binarnego wyniku uzyskanego przez narysowanie linii „znaczenia” w ciągłej miary dowodów.
Podczas interpretacji trendu ważne jest, aby powiązać wyniki z ustaleniami z literatury. Chociaż znajdujemy tutaj słaby trend, jest on zgodny z licznymi badaniami w literaturze, które wskazują na istotne korelacje tych dwóch zmiennych.
Jeśli chcesz to zrobić, odpowiednim ćwiczeniem jest wykonanie metaanalizy w celu uwzględnienia wszystkich danych z literatury. Sam fakt, że istnieje inna literatura zawierająca inne dane / dowody, nie uzasadnia traktowania danych w tym artykule inaczej niż w innym przypadku. Przeprowadź analizę danych na podstawie danych z własnego artykułu. Jeśli obawiasz się, że Twój własny wynik jest odchyleniem od literatury, zwróć uwagę na te inne dowody. Następnie możesz przeprowadzić odpowiednią metaanalizę, w której uwzględnione są wszystkie dane (Twoja i inna literatura), lub przynajmniej powiadomić czytelnika o zakresie dostępnych danych.
Oto odpowiedź mojego przełożonego: sprzeciwiłbym się w inny sposób: jeśli nie ma już znaczenia w próbie 71, jest zbyt słaba, aby ją zgłosić. Jeśli jest silny sygnał, zobaczymy go również w mniejszej próbce. Czy mam nie zgłaszać tego „nieistotnego” wyniku?
Decyzja, aby nie raportować danych, ponieważ wyniki statystyczne różnią się od innych literatury, jest straszną, okropną praktyką , która jest statystycznie bankrutem. Istnieje mnóstwo literatury poświęconej teorii statystycznej, ostrzegającej przed problemem stronniczości publikacji, która pojawia się, gdy naukowcy pozwalają, aby wyniki ich testów statystycznych wpłynęły na ich decyzję dotyczącą zgłaszania / publikowania danych. Rzeczywiście, stronniczość publikacji spowodowana decyzjami o publikacji podejmowanymi na podstawie wartości p jest zmorą literatury naukowej. Jest to prawdopodobnie jeden z największych problemów w praktyce naukowej i akademickiej.
Niezależnie od tego, jak „słabe” są dowody uzasadniające hipotezę alternatywną, zebrane dane zawierają informacje, które należy zgłosić / opublikować.Dodaje 77 punktów danych do literatury, niezależnie od tego, co jest warte.Powinieneś zgłosić swoje dane i podać wartość p dla swojego testu.Jeśli nie stanowi to statystycznie istotnego dowodu badanego efektu, niech tak będzie.