woensdag 14 maart 2012
De oneindige knuffelfactor van het getal pi | Actuele wiskunde | Wiskunde is sexy
Door Rudi Penne en Paul Levrie, 14 Maart 2012, 10:25
Nu de magie van het getal π eindelijk is doorgedrongen tot de kring der BV's (bedankt Tom Waes!), en vrienden/familieleden op feestjes spontaan en trots de decimalen ervan beginnen te reciteren, willen we ervoor zorgen dat deze π-dag zeker niet onopgemerkt voorbij gaat. Naar jaarlijkse traditie hebben we een aantal π-curiosa bij elkaar gezocht.
dinsdag 6 december 2011
Da Vinci’s boomobservatie nader onderzocht
De eenvoudige maar verrassende vuistregel, voor het eerst waargenomen door Leonardo da Vinci 500 jaar geleden, geldt voor bijna alle soorten bomen. Grafische kunstenaars maken van deze regel dankbaar gebruik om realistische computergegenereerde bomen te tekenen.
De regel zegt dat als een boomstam zich splitst in twee takken, de totale doorsnede van die twee takken qua oppervlak even groot is als de doorsnede van de stam. En ook als die twee takken zich op hun beurt weer opsplitsen in twee dunnere takken, is de gezamenlijke oppervlakte van de doorsnedes van die vier takken opnieuw gelijk aan de oppervlakte van de doorsnede van de stam. En ga zo maar door. Met andere woorden: als we een boom samenpersen tot één massief geheel, maar wel zó dat elk punt van de boom op dezelfde hoogte blijft, dan ontstaat er één grote cilindervorm.
Rechts: een computergegenereerde fractalboom. Afbeelding: © Christophe Eloy / University of Provence
In formulevorm zegt de regel van Leonardo da Vinci dat als een tak met diameter D splitst in een willekeurig aantal, zeg n, takken met diameters d1, d2, …, dn, het volgende geldt: D2 = d12 + d22 + … + dn2. In deze formule staan kwadraten van diameters, omdat het om oppervlaktes gaat; vergelijk de formule πr2 voor de oppervlakte van een cirkel met straal r.
In werkelijkheid zijn de exponenten die in bovenstaande formule voorkomen, niet altijd exact 2, maar een waarde tussen 1,8 en 2,3. Dit varieert per soort boom en is afhankelijk van de vorm. Afgezien van deze kleine verschillen geldt de formule voor vrijwel alle bomen.
De verklaring
Biologen hebben lange tijd gedacht dat Da Vinci’s formule te maken heeft met de manier waarop bomen water via hun wortels in zich opnemen en naar hun bladeren voeren. Maar Christophe Eloy, natuurkundige van de universiteit van Provence en tijdelijk verbonden aan de universiteit van Californië, denkt aan iets anders. Hij gelooft niet dat het te maken heeft met de manier waarop de bladeren van water worden voorzien, maar dat het afhangt van de manier waarop de bladeren wind vangen als het hard waait.
Eloy maakte een wiskundig model waarbij hij bomen modelleert als fractals. Fractals zijn wiskundige figuren die zichzelf op steeds kleinere schaal herhalen – de meeste bomen hebben bij goede benadering een fractalstructuur. Eloys model werd op de proef gesteld in een virtuele windtunnel. Hij bepaalde wat de diameter van elke tak moet zijn, opdat de kans op het afbreken bij een hoge windkracht klein blijft. De simulatie bleek precies Da Vinci’s regel op te leveren.
Eloys bevindingen worden binnenkort gepubliceerd in Physical Review Letters. Wetenschappers hopen dat ze met verder onderzoek naar Da Vinci’s regel meer te weten komen over de structuur van bossen, de evolutie van de bomen en schade die door wind wordt veroorzaakt.
Zie ook:
dinsdag 28 juni 2011
Tau, de constante der constanten
In 1988 promoveerde de wiskundige Matthijs Coster, redacteur van het tijdschrift Pythagoras. Een van zijn stellingen destijds luidde: De Grieken hadden vele generaties wiskundigen en natuurkundigen moeite kunnen besparen door π te definiëren als het quotiënt van de omtrek van een cirkel en de bijbehorende straal.
Coster is niet de enige die met de gekozen definitie van π (pi) moeite heeft. In 2001 verscheen in The Mathematical Intelligencer het artikel π is wrong! van Bob Palais. En exact één jaar geleden publiceerde Michael Hartl het tau-manifest.
Coster, Palais en Hartl hebben een punt. π is niet de meest logische keuze voor de cirkelconstante. In het tau-manifest komt Hartl met een goed alternatief: τ (tau), ofwel het dubbele van π.
Pi en tau
π is een van de belangrijkste wiskundige constantes, zo niet dé belangrijkste. Het is gedefinieerd als de verhouding tussen de omtrek en de diameter van een cirkel:
π = omtrek/diameter = 3,14159265…
Een cirkel is per definitie de verzameling van alle punten die op gelijke afstand – de straal – van een vastgekozen punt liggen. Een natuurlijkere definitie voor de cirkelconstante zou daarom eigenlijk zijn: omtrek gedeeld door straal, in plaats van omtrek gedeeld door diameter.
Omdat de diameter gelijk is aan twee keer de straal, is de constante omtrek/straal gelijk aan 2π. Michael Hartl stelt voor om deze constante aan te duiden met τ en π zo snel mogelijk te vergeten. Dus:
τ = omtrek/straal = 6,28318530…
Radialen
Hoeken kun je meten in graden, maar wiskundigen gebruiken meestal de radiaal als hoekeenheid. Op een cirkel met straal 1 is een hoek in radialen, gemeten vanuit het middelpunt van de cirkel, per definitie gelijk aan de lengte van de bijbehorende cirkelboog. Een hoek van 90 graden komt dus overeen met een half π radialen, want de bijbehorende booglengte op een cirkel met straal 1 is ½π. En daar heb je het gedonder al: een kwart cirkel is een half π radialen. En een halve cirkel is een heel π radialen. Zie het middelste plaatje hieronder. Kan het verwarrender? Met τ wordt alles veel logischer, zoals uit het rechter plaatje blijkt. τ komt precies overeen met 1 draaiing. Draai je een twaalfde deel, dan komt dat overeen met τ/12. Een stuk handiger dan π/6, of niet soms?
Lelijke formules
Intrigerend aan π, of beter gezegd 2π, is dat dit getal zich niet beperkt tot de (cirkel)meetkunde. De constante is alomtegenwoordig: in heel veel bekende formules, in tal van takken van de wiskunde, duikt 2π op. Hieronder zie je er een paar (in het rode kader). Het gaat hier om een integraal uitgedrukt in poolcoördinaten, de kansdichtheid van de normale verdeling, een Fouriertransformatie, Cauchy’s integraalformule en de waarden van de Riemann-zeta-functie voor positieve even getallen. Rechts (in het groene kader) staat steeds het bijbehorende equivalent waarbij 2π is vervangen door τ. We moeten toegeven: die formules zien er fraaier uit.
De mooiste formule ooit
Met enige regelmaat verschijnen er lijstjes met ‘de mooiste formule aller tijden’. Wiskundeliefhebbers zijn het er meestal over eens dat de identiteit van Euler, eπi = –1, de allermooiste is die de wiskunde te bieden heeft.
Dat minteken wordt echter zo lelijk gevonden, dat de formule meestal zo wordt geschreven: eπi + 1 = 0, waarbij dan meteen wordt opgemerkt dat deze formule de vijf belangrijkste constantes bevat: 0, 1, e, i en π. Een uitvlucht om van die min af te komen. Gebruik τ in plaats van π en de min verdwijnt ook, want eτi = 1. Kan het mooier?
Cirkeloppervlak: de genadeslag?
De definitie van τ is zó natuurlijk, zijn betekenis zó transparant. Is er dan geen enkel voorbeeld te bedenken waarbij π wél handiger is dan τ? Ja, denk je nu, de oppervlakte van een cirkel! Een cirkel met straal r heeft oppervlakte πr2. Hier zien we π verschijnen in een belangrijke en veelgebruikte formule, zónder die ellendige factor 2 ervoor. Is dat dan een reden om toch maar van τ af te zien? Nee, integendeel, juist hier is de extra factor van ½ die ontstaat als we de formule met τ schrijven, meer dan welkom! Bekijk maar eens het volgende lijstje van formules:
y = ½gt2 (afgelegde afstand),
Ep = ½kx2 (potentiële energie),
Ek = ½mv2 (kinetische energie).
Net als de formule voor de oppervlakte van een cirkel zijn dit allemaal kwadratische formules. Dus
O = ½τr2 (oppervlakte cirkel)
past prima in dit rijtje thuis, veel beter dan O = πr2.
28 juni: taudag
14 maart is het pidag. Dat komt zo: 14 maart kun je schrijven als 14/3 zoals wij doen, maar ook als 3/14 zoals ze in Amerika doen, of liever nog: 3.14. En zie, daar staat de waarde van π in twee decimalen. Om dezelfde reden kunnen we 28 juni als taudag bestempelen. Een veel mooiere datum dan 14 maart, natuurlijk. Immers, 6 en 28 de eerste twee perfecte getallen, dus 6.28 (op z’n Amerikaans) is een perfecte dag. Bovendien is het op 28 juni gemiddeld genomen mooier weer voor festiviteiten. Dus: gooi je T-shirt met π maar weg, en bestel het coole τ-shirt. Daarmee kun je voor de dag komen!
Dit logo gebruikt Google op pidag. Het wordt hoog tijd dat de Google-ontwerpers zich over een logo gaan buigen ter ere van τ.
Waarom τ?
Waarom de letter τ? Daar zijn een paar redenen voor. Ten eerste is Eulers indentiteit, eτi = 1, een tautologie. In wezen is élke wiskundige stelling een tautologie, maar vooruit: omdat Eulers identiteit als de ‘mooiste formule allertijden’ is bestempeld, gaat het hier wel om een hele bijzondere tautologie. Een tweede reden is dat τ typografisch op π lijkt, maar toch zonder dat er verwarring ontstaat. Meer redenen zijn te vinden op de website van het tau-manifest.
Tau beweegt door yin en yang. Van 0 tot ½τ is er een beweging door yang (wit, licht), daarna is er een beweging door yin (zwart, donker) tot je weer bij τ uitkomt. Gebruik je π in plaats van τ, dan is dat zoiets als yang zonder yin. Onvolmaakt dus.
zondag 13 maart 2011
Wat u door 'n goede ezelsbrug te kennen immer met gemak onthoudt | Actuele wiskunde | Wiskunde is sexy
Het is weer zover. Naar jaarlijkse traditie (de vorige versie vind je hier) presenteren we hier ter lering en vermaak en in afwachting van de speciale feestdag van volgend jaar opnieuw een hele resem
Wist je ...
… dat het op maandag 14 maartπ -dag is? Waarom? Omdat in de Amerikaanse schrijfwijze de datum 14 maart genoteerd wordt als 3/14 en 3,14 is een benadering voor het getalπ .… dat op 3 augustus 2010 een nieuw wereldrecord decimalen-van-π -berekenen is gevestigd door de Japanse ingenieur Shigeru Kondo?
In totaal werden 5 000 000 000 000 decimalen berekend, op een zelfgemaakte computer met een harddisk van 32 TB. Kondo gaat nu voor het dubbele aantal decimalen. Yukiko, de vrouw van Kondo, is er niet echt blij mee, want hun elektriciteitsrekening schoot de hoogte in.
… dat Nicholas Sze, een onderzoeker bij Yahoo, in september 2010 ook eenπ -record gebroken heeft? Hij berekende het 2 000 000 000 000 000ste binaire cijfer na de komma, en het bleek een 0 te zijn. Voor de berekening werden meer dan duizend computers tegelijk ingeschakeld. Merk op dat als je zelf deze waarde zou hebben proberen te raden, dat je één kans op twee gelijk had.
Ter info, de eerste binaire cijfers vanπ zijn:
11,
00100100 00111111 01101010 10001000
10000101 10100011 00001000 11010011
00010011 00011001 10001010 00101110
00000011 01110000 01110011 01000100
10100100 00001001 00111000 00100010
00101001 10011111 00110001 11010000
00001000 00101110 11111010 10011000
11101100 01001110 01101100 10001001
… dat het getalπ echt wel voorkomt in de natuur? Bewijs ervan zie je op de volgende foto, een variant van de spinnenorchis (Ophrys Sphegodes) die we misschien sπ nnenorchis kunnen noemen?
… dat de wiskundige Pierre Simon de Laplace in 1811 de volgende prachtige formule bewees die de getallenπ en e combineert?∫−∞+∞cosxx2+1dx=πe … dat er ook in 2010 nog nieuwe formules gevonden zijn waarin het getalπ een prominente plaats inneemt? Bijvoorbeeld de volgende:π3=2167∑n=0∞(2nn)16n(2n+1)3
(Pilehrood & Pilehrood).… dat er sinds het begin van de vorige eeuw mensen zijn die zich bezighouden met het maken van zinnen waarin de lengtes van de opeenvolgende woorden de decimalen vanπ zijn? Het bekendste voorbeeld is wellicht:
How I need a drink, alcoholic in nature, after the heavy lectures involving quantum mechanics!
Een probleem hierbij is natuurlijk: wat als er een 0 optreedt? De afspraak is dan: komt overeen met een woord van 10 letters. Ook als er enkele kleine cijfers verschillend van 0 elkaar opvolgen: daarmee kunnen we woorden van meer dan 10 letters laten overeenkomen, bijvoorbeeld 1211 kan dan 12 letters - 11 letters worden. Met deze afspraken (en nog enkele meer) kunnen we nu een boek schrijven dat de decimalen vanπ verwoordt. Dat is precies wat Mike Keith gedaan heeft, in Not A Wake: A Dream Embodyingπ 's Digits Fully For 10000 Decimals.
Het boek bestaat uit 10 secties, elke sectie komt overeen met 1000 decimalen.
Zo begint het boek:
Now I fall, a tired suburbian in liquid under the trees
Drifting alongside forests simmering red in the twilight over Europe.
So scream with the old mischief, ask me another conundrum
About bitterness of possible fortunes near a landscape Italian.
Merk op dat ook de titel voldoet aan de voorwaarden...… dat op het graf van de wiskundige Ferdinand von Lindemann het getalπ staat?
Hier zie je het bewuste detail:
Omheenπ staan een cirkel en een vierkant die met elkaar verstrengeld zijn.
Dit alles heeft te maken met het feit dat von Lindemann als eerste bewees dat het getalπ transcendent is, d.w.z. geen oplossing is van een algebraïsche vergelijking met gehele coëfficiënten. Een onmiddellijk gevolg hiervan is dat de kwadratuur van de cirkel (met enkel passer en liniaal een vierkant construeren met exact dezelfde oppervlakte als een gegeven cirkel) onmogelijk is.… dat er wetenschappers zijn die vinden datπ verkeerd is? Ze bedoelen hiermee dat het een foute keuze was het getal3,1415... voor te stellen met de afkortingπ . Het was logischer geweest het dubbele, namelijk6,2831 met de letterπ aan te duiden. Het zou het lezen van deπ -klok alvast een stuk gemakkelijker maken: links zie je de huidige situatie, rechts die bij de andere keuze.
… dat we ondertussen ook weten waarom precies pi(e) gebruikt wordt als benaming voor deze constante?
… dat we tenslotte nu ook begrijpen waar de pi in 'piano' vandaan komt?
dinsdag 8 maart 2011
Zondag pi-dag, maar vandaag de dag van de vrouw (van Ludolf Van Ceulen)
Allicht wist je dat het op zondag 14 maart π-dag is? Waarom? Omdat in de Amerikaanse schrijfwijze de datum 14 maart genoteerd wordt als 3/14 en 3,14 is een benadering voor het getal π. We hebben hierover vroeger al geschreven, i.v.m. graancirkels en ook hier.
Toevallig is het ook dit jaar precies 400 jaar geleden dat Ludolf Van Ceulen, die vooral bekend (gebleven) is door zijn berekening van het getal π tot op 35 decimalen, stierf. In zijn boek Vanden Circkel heeft hij de berekening van de eerste 20 decimalen beschreven. Je ziet hier een uittreksel uit de tweede editie van 1615:
...dat op 31 december 2009 een nieuw wereldrecord decimalen-van-π-berekenen is gevestigd door Fabrice Bellard? In totaal werden 2 699 999 990 000 decimalen berekend, op een gewone desktop computer. De berekening is gedaan met wat bekend staat als de Chudnovsky reeks:
...dat de laatste twee van de 16 decimalen van π die Isaac Newton eigenhandig berekende in 1665-1666 fout waren? Newton gebruikte de volgende integraal:
Newton zei achteraf zelf: "I am ashamed to tell you to how many figures I carried these computations, having no other business at the time".
... dat de getallen van de rij van Fibonacci gebruikt kunnen worden om een benadering van π te berekenen?
Als we de getallen van deze rij van Fibonacci voorstellen door Fn: F0=1, F1=1, F2=2, F3=3 en Fn+2=Fn+1+Fn, dan kunnen we eenvoudig bewijzen dat
...dat er veel pandigitale benaderingen zijn voor π? Pandigitaal betekent dat elk cijfer van 1 tot 9 er precies 1 keer in voorkomt. Hier is een voorbeeld. Het getal
...dat in de 21ste aflevering ("Marge in de boeien") van het vierde seizoen van de reeks The Simpsons de eigenaar van de Springfieldse Kwik-E-Mart Apu Nahasapeemapetilon in de rechtbank zegt dat hij in staat is 40000 decimalen van het getal π op te zeggen? Apu merkt verder terecht op dat het 40000ste cijfer gelijk is aan 1. Blijkbaar hebben de schrijvers van deze aflevering deze scene voorbereid door aan de NASA te vragen wat de 40000ste decimaal van π is. NASA heeft hen dan een uitprint gestuurd van de eerste 40000 cijfers.
...dat het naaldenexperiment van Buffon niet de enige vreemde methode is om een benadering te vinden voor het getal π? Botsingen tellen in een eenvoudig dynamisch systeem met twee bollen kan ook. Het verschil met Buffon is dat deze methode volledig deterministisch is, en dat je er π mee kan berekenen tot op gelijk welke nauwkeurigheid. Hier zie je de opstelling:
main(){for(;b=c-=14;h=printf("%04d",
e+d/f))for(e=d%=f;g=-b*2;d/=g)
d=d*b+f*(h?a[b]:f/5),a[b]=d%-g;}
...dat eπ√ 163 en eπ-π twee bekende voorbeelden zijn van getallen die bijna geheel zijn (almost integer)?
(http://www.xkcd.com)
Hier vind je deze informatie in flyer-vorm, ter lering en vermaak van vrienden en/of collega's.
"
vrijdag 26 november 2010
We were all Africans…before the intermission | Gene Expression
Quick review. In the 19th century once the idea that humans were derived from non-human ancestral species was injected into the bloodstream of the intellectual classes there was an immediate debate as to the location of the proto-human homeland; the Urheimat of us all. Charles Darwin favored Africa, but in many ways this ran against the cultural grain. The theory of evolution was birthed before the highest tide of the age of white supremacy and European hegemony, and Darwin’s model had to swim against the conviction that Africans were the most primitive of the colored races. After the waning of the ideological edifice of white supremacy, and the shock it received during and after World War II, the debates as to the origin of humanity still remained contentious and followed the same outlines (though without the charged normative inferences). But as the decades wore on many more researchers began to believe that Darwin was correct, and that the origin of humanity lay in the African continent. First, the deep origin of the human lineage in Africa was accepted, but eventually a more recent expansion out of Africa was argued for by one school. The turning point in these academic disputes was the popularization of the “mitochondrial Eve” theory of the 1980s.
What some paleontologists had long argued, that anatomically modern humans have their locus of origin in Africa, was supported now by research from genetics which indicated that Africans were the most basal clade of humans on a continental scale, so that non-Africans could be conceived of as a subset of Africans. From this originates the chestnut of wisdom that Africans have more genetic diversity than all other human populations combined. By the year 2000 one could say that the “Out of Africa” triumphalism had proceeded to the point where an almost exterminationist model had taken hold when it came to the relationships of anatomically modern H. sapiens, and other groups which had evolved outside of Africa over the past million or so years, such as the Neandertals.
But the theoretical dichotomies were too coarse and absolute as it turns out. A division between multiregionalist phyletic gradualism, where H. sapiens evolved out of its hominin ancestors concurrently on a world wide scale, and a model of rapid expansion of one tribe in Africa to replace all others in totality, may have been warranted in the age of classical genetics and a morphometric analysis, but now we can look at the raw genomic material in a more fine-grained fashion. In fact, we can now look at the genomic patterns of variation among extinct hominins! Though there have long been hints that the expansion-and-replacement paradigm was too extreme from the genetic and morphological data, with the publication last spring in Science of a paper which made the claim for admixture between Neandertals and non-Africans in the range of 1-4% in all non-African groups based on a comparison of Neandertal and modern human genetic variation, one can dismiss absolutist expansion-and-replacement as self-evidently true orthodoxy. But one orthodoxy has no given way to another, and the shock to the old models presented by the data has not resulted in the coalescence of new robust paradigms. We live in a time of scientific troubles, so to speak.
One of the more notable results in the Science paper from last spring was that all non-Africans had about the same admixture in relation to the Neandertal reference genome, ~1-4%. This means from the Orkneys to New Guinea. Because Neandertals were distributed only in the western half of Eurasia this implies that the admixture was an early event. By the time of modern human expansion across Eurasia, Australasia, and the New World, it had become equally distributed across the individuals within the population. Recall the contrast between African Americans and Uyghurs. Among the Uyghurs the ancestral quanta are equitably distributed from individual to individual, but among African Americans there remains substantial intra-population variance. The reason is that African Americans are quite new, an order of magnitude younger than the Uyghurs in a genetic sense, and admixture is still occurring into the African American population from the ancestral groups. The Uyghurs as we known them today genetically are probably ~1,000-2,000 years old (though their cultural origins are both more and less ancient, as a matter of linguistics in the former, and ethnic self-conception as a Muslim East Turkic group in the latter). The implication here is clear: there was a pause in the Out of Africa movement, where the proto-non-Africans mixed with a Neandertal group, possibly in the Middle East, and only began a massive demographic expansion after an unspecified sojourn. A paper from last spring makes this all explicit:
A more likely explanation for the OoA bottleneck is that Eurasia was populated by a larger population that had been relatively isolated from other modern human populations for tens of thousands of years prior to the expansion. The first fossil evidence for modern humans outside of Africa is in the Middle East at Skhul and Qafzeh between 80,000-100,000 years ago, which is at least 20,000 years prior to the Eurasian diaspora. If a population of modern humans remained in the Middle East until the expansion into Eurasia, there would have been sufficient time for genetic drift to reduce heterozygosity dramatically before the Eurasia expansion. This “Middle East isolation” hypothesis provides a robust explanation for the relative homogeneity of European and Asian populations relative to African populations (see Figures 3A-B) and is supported by a recent maximum likelihood estimate of 140,000 years ago for the time of Eurasian-West African population separation . Interestingly, a recent study of the Neandertal genome suggests that the non-African individuals, but not the Africans, contain similar amount of admixture (1-4%) with the Neandertals . The authors suggest that the admixture must have happened between the Neandertals with an ancestral non-African population before the Eurasian expansion. Given the fossil, archaeological, and genetic evidence, the Middle East isolation hypothesis warrants rigorous evaluation as whole-genome sequence data become available.
Now the same group has published a follow up paper in Genome Biology which fleshes out the Deep Time aspect of human evolutionary history by looking closely at the genetic variation of an under-sampled population: South Asians. You may have noticed that the HGDP populations include Pakistani groups as South Asian exemplars. That’s apparently because during the Permit Raj era in India the government was wary of cooperating with the HGDP consortium. But more recently the barriers have come down in India, and one can viably supplement the data sets with Indian Americans. So the GIH sample in HapMap3 consists of Gujaratis from Houston. At ~1.25 billion, or nearly 20% of the world’s population, South Asians are a critical portion of the “big picture” when it comes to world wide genetic variation.
Genetic diversity in India and the inference of Eurasian population expansion:
To analyze an unbiased sample of genetic diversity in India and to investigate human migration history in Eurasia, we resequenced one 100 kb ENCODE region in 92 samples collected from three castes and one tribal group from the state of Andhra Pradesh in south India. Analyses of the four Indian populations, along with eight HapMap populations (692 samples), showed that 30% of all SNPs in the south Indian populations are not seen in HapMap populations. Several Indian populations, such as the Yadava, Mala/Madiga, and Irula, have nucleotide diversity levels as high as those of HapMap African populations. Using unbiased allele-frequency spectra, we investigated the expansion of human populations into Eurasia. The divergence time estimates among the major population groups suggest that Eurasian populations in this study diverged from Africans during the same time frame (approximately 90-110 thousand years ago). The divergence among different Eurasian populations occurred more than 40,000 years after their divergence with Africans.
First, I want to put into the record that I think there are high enough uncertainties (evident in the confidence intervals in the paper itself) that we need to be careful about taking the divergence times from their results as values we’d bet the house on. Someone with a better knowledge of the fossils (e.g., John Hawks) or controversies about the mutational rates (e.g., Dienekes) can comment on the plausibilities of the dating. But, I think we can infer that there was a time lag closer to a 10,000 years order of magnitude than 1,000 years when it comes to the Middle Eastern sojourn of non-African humans.
The basic method here is that the research group zoomed in on a ~100 kb region of the genome, on chromosome 12, and surveyed their Indian populations, as well as the HapMap3 ones. This is important because the SNPs in the HapMap probably exhibit an ascertainment bias toward variants in European and other more widely surveyed groups. The fact 30% of the SNPs in the South Indian groups seem to not be found among the HapMap populations confirms this hunch. Before digging into the details of the paper, let’s note that the South Indian groups are from the state of Andhara Pradesh, Brahmins, a lower caste group (Yadava), Dalits (Mala/Madiga), and a tribe (Irula). This is a case where even more thorough coverage is necessary. There is some suggestion that South Asian groups have a long history of endogamy and genetic peculiarities, which would limit the usefulness of extrapolations from this sample. Even within the HapMap Gujarati sample there seems to be two clusters when the PCA is used with reference to the European samples.
There are basically three portions of the paper:
- A survey of conventional population genetic statistics,
θ = 4Neμ (Ne = effective population, μ = mutation rate)
π = nucleotide diversity
H = heterozygosity
D = Tajima’s D
- Measures of genetic distance between contemporary populations, Fst and PCA
- Finally, taking the genetic variance from the ~100 kb and plugging it into explicit models of human evolutionary history
Table 1 (I reformatted) shows the genetic statistics by “continent.” Indian includes some Gujarati individuals. They sampled out of the HapMap populations to equalize the numbers.
Some of these results are striking. The general truism is that Africans are the most diverse population in the world, but some of the South Indian groups are very diverse indeed. Of particular interest though is that some Indian groups are not very diverse at all. What’s going on here? Here you have to look at the specifics of each group. It is likely that South Indian Brahmins are the result of a relatively recent population expansion, with some uptake of other genes through hypergamy. A paper from last year argued that all Indian populations can be modeled as a two-way admixture of different quantities from two ancestral groups, Ancient North Indians and Ancient South Indians. The heterozygosity values may be explained in such a fashion, though the relatively low values for Gujaratis and Andhara Pradesh Brahmins would still surprise. Frankly, I’m just mostly confused by the diversity statistics. Probably the substructure through endogamy and population bottlenecks are obscuring broader dynamics. We can, though, conclude that the idea that all non-Africans are uniformly homogeneous in comparison to Africans may not hold water. Figure 2 above illustrates this by plotting heterozygosity vs. distance from Africa.
Next, let’s move to genetic distance. There’s two ways you can look at this: a summary statistic like Fst, which partitions between and within population variance, and PCA, which visualizes the largest dimensions of variations in the data set. So you have both below (reedited for reasons of space):
In the generality the results are expected, but there are weird details. For example, the Brahmins from Andhara Pradesh are on the margins, where you’d expect them to cluster with the Gujaratis. The Gujaratis are closer to the Chinese from Denver than Utah Whites? This is a provisional paper, so I’m almost wondering if there’s a typo or coding error here, as I don’t understand how the GIH can be so close to the Tuscans and Chinese from Denver, and much further from the Northern Europeans and Chinese from Beijing. The two European and Chinese samples are rather close in other analyses.
So let’s get to the real deal. The modified Out of Africa model where non-Africans take a “break” after they leave the mother continent:
I’ve mashed up the figures. The models were generated by looking at allele frequencies. They took the variants they found by sequencing the ~100 kb on chromosome 12, which was in a very gene-poor region so as to bias it toward neutrality, and plugged them into a few models in the ∂a∂i program. I’ll jump to the text here:
…the divergence time between African and the ancestral Eurasian population (88-112 kya, CIs: 63-150 kya) is much older than the divergence time among the Eurasian groups (27-39 kya, CI: 20-59 kya). The more recent divergence time and the low migration rate estimates among the current Eurasian populations support the “delayed expansion” hypothesis for the human colonization of Eurasia (Figure 5). Consistent with previous studies…these estimates indicate that a single Eurasian ancestral population remained separated from African populations for more than 40 thousand years prior to the population expansion throughout Eurasia and the divergence of individual Eurasian populations.
Manafi al-Hayawan, Adam and Eve
Take a good look at those confidence intervals. We know that some of those have to be false: the bones don’t lie. From what little I know a very young consensus date for the settlement of Australasia by modern humans is 40,000 years ago. That happens nicely to be their median, but the dispersion toward younger dates is probably not right, unless Aborigines are a separate population who are remnants of an earlier wave of migrants (or the current Aborigines replaced earlier waves). It is also hard to reconcile these dates for the diversification of non-African humanity with very old dates for Chinese fossils which exhibit some elements of modern morphology.
In the broad outlines I think we can accept that the model outlined in this paper may be correct. It would explain the uniform admixture of Neandertal in non-Africans, since they’d need time as a compact population before demographic expansion to integrate the Neandertal genes as part of their genetic background. But before the Neandertal genome came out there were plenty of papers which purported to show how there was no archaic admixture in modern humans, and plenty of papers which did claim there was evidence for such admixture. The point is that these computational models are sensitive to their inputs, and being models they simplify what really happened. In the discussion the authors repeatedly observe that migration between the various non-African demes doesn’t effect the outcome. That is fine, but there is modestly strong evidence that the Indian samples that they’re using are an admixed population of old. That would make me skeptical of claims about dating the separation of “Indians” when Indians are themselves possibly a compound between other groups.
Below is the model presented from Reconstructing Indian population history:
The teens of this century are going to be very exciting when it comes to reconstructing human evolutionary history. You’d be a fool to put bets on any horse at this time.
Addendum: I need a term for non-African humanity. So I’m making up one right now: Eurausicans. From Eurasians, Australasians, and Americans.
Citation: Jinchuan Xing, W Scott Watkins, Ya Hu, Chad D Huff, Aniko Sabo, Donna M Muzny, Michael J Bamshad, Richard A Gibbs, Lynn B Jorde, & Fuli Yu (2010). Genetic diversity in India and the inference of Eurasian population expansion Genome Biology : 10.1186/gb-2010-11-11-r113