Beweis für Praktiker
Bisher wurden mittels "brute force" alle Zahlen bis 268 durchprobiert, ohne eine einzige zu finden, für die die Collatz-Vermutung nicht zutrifft.
Auf Grundlage dieser Tatsache wird fast jeder praktisch denkende Mensch zum Schluss kommen, dass die Vermutung hinreichend sicher bewiesen ist.
Man kann aber auch noch den Trend der Entwicklung der Pfadlänge `bb "P"_H(n)` untersuchen und extrapolieren, um abzuschätzen, in welche Richtung sich diese bewegt. Wie schon in einem früheren Abschnitt erwähnt, ist die Pfadlänge `bb "P"_H(n)` die Anzahl der Iterationen der `bb "H"`-Funktion bis zum erstmaligen Erreichen der Zahl 1. Falls die Folge über alle Grenzen wächst oder falls sie in einen Zyklus ohne die 1 gerät, gilt also `bb "P"_H(n) = oo`.
Wenn man nun eine Reihe ungerader Zahlen und deren Pfadlänge `bb "P"_H(n)` betrachtet und vielleicht in ein Diagramm einzeichnet (wie im vorigen Abschnitt getan) erkennt man, dass diese Reihe für eine größere Zahl schlecht zu extrapolieren ist. Es ist auch wenig sinnvoll, Energie zu verpulvern, um die Folgen von immer größeren Zahlen zu berechnen. Zumal das ja immer nur ein winziger Bruchteil aller Zahlen sein kann.
Wie machen es andere Leute, wenn sie mehr Tests durchführen müssen, als Ressourcen vorhanden sind? Und wenn davon auszugehen ist, dass das Ergebnis der meisten Tests negativ ist und nur das Ergebnis von wenigen oder keinen Tests positiv? So war es zum Beispiel vor einem reichlichen Jahr beim Beginn der Corona-Pandemie. Manche Labore haben dann einfach einen Teil von mehreren Proben zusammen gemischt und diese Mischung untersucht. War sie negativ, war alles ok, war sie positiv, mussten die einzelnen Proben doch noch untersucht werden, um die positive(n) Probe(n) zu identifizieren. Es wurde also erst mal der Mittelwert mehrerer Proben gebildet.
So machen wir es auch. Allerdings ist es entscheidend, die Größe der Zahlenbereiche, von deren Pfadlänge `bb "P"_H(n)` Mittelwerte gebildet werden sollen, sinnvoll festzulegen.
Fasst man zum Beispiel `bb "P"_H(n)` für immer 1000 fortlaufende ungerade Zahlen zusammen und bildet dafür den Mittelwert `bb bar "P"_H(n)`, so entsteht eine Wertereihe, deren Verlauf kaum weniger stochastisch aussieht als der ursprüngliche Verlauf von `bb "P"_H(n)`.
Die Lösung besteht darin, keine gleich großen Zahlenblöcke zu bilden, über die gemittelt wird. Da oft gilt `bb "P"_H(n) = bb "P"_H(2n + 1)`, legen wir einfach die 2er-Potenzen als Bereichsgrenzen fest.
Es entsteht folgende Tabelle:
`x` | `2^x` | `n_min` | `n_max` | `a` | `s` | `m(x)` |
---|---|---|---|---|---|---|
1 | 2 | 3 | 3 | 1 | 2 | 2 |
2 | 4 | 5 | 7 | 2 | 6 | 3 |
3 | 8 | 9 | 15 | 4 | 17 | 4,25 |
4 | 16 | 17 | 31 | 8 | 106 | 13,25 |
5 | 32 | 33 | 63 | 16 | 240 | 15 |
6 | 64 | 65 | 127 | 32 | 589 | 18,40625 |
7 | 128 | 129 | 255 | 64 | 1326 | 20,71875 |
8 | 256 | 257 | 511 | 128 | 2803 | 21,8984375 |
9 | 512 | 513 | 1023 | 256 | 6284 | 24,546875 |
10 | 1024 | 1025 | 2047 | 512 | 14064 | 27,46875 |
11 | 2048 | 2049 | 4095 | 1024 | 30861 | 30,1376953125 |
12 | 4096 | 4097 | 8191 | 2048 | 66061 | 32,25634765625 |
13 | 8192 | 8193 | 16383 | 4096 | 140076 | 34,1982421875 |
14 | 16384 | 16385 | 32767 | 8192 | 297125 | 36,2701416015625 |
15 | 32768 | 32769 | 65535 | 16384 | 636005 | 38,8186645507812 |
16 | 65536 | 65537 | 131071 | 32768 | 1355579 | 41,3689880371094 |
17 | 131072 | 131073 | 262143 | 65536 | 2869444 | 43,7842407226563 |
18 | 262144 | 262145 | 524287 | 131072 | 6054704 | 46,1937255859375 |
19 | 524288 | 524289 | 1048575 | 262144 | 12720264 | 48,5239562988281 |
20 | 1048576 | 1048577 | 2097151 | 524288 | 26695392 | 50,9174194335938 |
21 | 2097152 | 2097153 | 4194303 | 1048576 | 55918743 | 53,3282690048218 |
22 | 4194304 | 4194305 | 8388607 | 2097152 | 116846879 | 55,7169337272644 |
23 | 8388608 | 8388609 | 16777215 | 4194304 | 243827113 | 58,1329138278961 |
24 | 16777216 | 16777217 | 33554431 | 8388608 | 507891910 | 60,5454337596893 |
25 | 33554432 | 33554433 | 67108863 | 16777216 | 1056081284 | 62,9473497867584 |
26 | 67108864 | 67108865 | 134217727 | 33554432 | 2193314958 | 65,3658794760704 |
27 | 134217728 | 134217729 | 268435455 | 67108864 | 4548270861 | 67,7745172530413 |
28 | 268435456 | 268435457 | 536870911 | 134217728 | 9419543020 | 70,1810644567013 |
29 | 536870912 | 536870913 | 1073741823 | 268435456 | 19485982261 | 72,5909406729043 |
30 | 1073741824 | 1073741825 | 2147483647 | 536870912 | 40264966142 | 74,999343868345 |
31 | 2147483648 | 2147483649 | 4294967295 | 1073741824 | 83115162770 | 77,407027380541 |
32 | 4294967296 | 4294967297 | 8589934591 | 2147483648 | 171404736417 | 79,816550210584 |
33 | 8589934592 | 8589934593 | 17179869183 | 4294967296 | 353159635993 | 82,2263853608165 |
Die Tabelle enthält folgende Spalten:
Spalte | Wert | Bedeutung |
---|---|---|
2 | `2^x` | Beginn des Zahlenbereichs |
3 | `n_min` | kleinste ungerade Zahl des Zahlenbereichs |
4 | `n_max` | größte ungerade Zahl des Zahlenbereichs |
5 | `a` | Anzahl der ungeraden Zahlen im Zahlenbereich: `a=2^(x-1)` |
6 | `s` | Summe der Pfadlängen für alle ungerade Zahlen im Zahlenbereich: `s = sum_(i=n_min)^(n_max) bb "P"_H(i)` |
7 | `m(x)` | Mittelwert der Pfadlängen für alle ungerade Zahlen im Zahlenbereich: `m(x) = s/a` |
Nun zeichnen wir die berechneten Mittelwerte in ein Diagramm:
Das sieht doch schon mal gut aus. Der Mittelwert steigt stetig an. Aber kann er auf unendlich steigen, bevor x unendlich wird?
Eine Analyse der Differenzen benachbarter Mittelwerte (also im Prinzip die erste Ableitung) bringt uns weiter:
`Delta m(x) = m(x) - m(x-1)`
`Delta m(x)` pegelt sich bei etwa 2,41 ein. Auch wenn man diese Kurve beliebig extrapoliert, ändert sich daran nichts.
Zur Kontrolle bilden wir von den Differenzen benachbarter Werte nochmals die Differenz (das entspricht der 2. Ableitung):
`Delta Delta m(x) = Delta m(x) - Delta m(x-1)`
`Delta Delta m(x)` geht sehr stark gegen 0. Auch wenn man diese Kurve beliebig extrapoliert, ändert sich daran nichts.
Aus diesen Kurvenverläufen kann man folgern, dass die Collatz-Vermutung wahr ist.
Angenommen, die Collatz-Vermutung sei falsch.
Dann sei `y` die kleinste Zahl, für welche die `bb "H"`-Funktion nicht bei 1 endet. Es gilt gilt also `bb "P"_H(y) = oo`.
Weiter sei `z` die Anzahl der Stellen von `y` im Dualsystem. Dann müsste auch der zugehörige Mittelwert `m(z)` unendlich sein.
Dann müsste auch die Differenz `m(z) - m(z-1)` unendlich sein.
Und schließlich müsste dann auch `Delta Delta m(z)` unendlich sein.
Das alles lässt sich mit dem Verlauf der Kurven nicht vereinbaren, zumal es ja im Bereich der natürlichen Zahlen auch oberhalb von `2^68` keine Singularitäten bezüglich der Grundrechenarten gibt.