Unique DNA sequences of various organisms were analyzed to understand the relationship between dinucleotide frequencies and GC contents. In general, dinucleotides in DNA sequences are over- or under-represented in comparison with the random or ideal sequences. DOEs (Observed per Expected Frequencies of Dinucleotides) were calculated and seemed to correlate with GC contents positively or negatively and generally have different values according to GC contents. DOE-GC distributions were speciesspecific and showed general trend. This trend divided organisms studied into roughly two groups, vertebrates and non-vertebrates. The dinucleotide-driven mutation pressure of D. melanogaster (the fruitfly) seems to be similar to that of E. coli. Also, the relation-ship between DFs (Frequencies of Dinucleotides) and GC contents was studied. Random-model for DF-GC distribution was proposed and with this model and DOE, human-model was predicted and evaluated to be correct. In general, there is the relationship, DF(x) = DOE(x)$\cdot$DF$_e$(x), in the natural DNA sequences, where x is the GC fraction, and DF$_e$(x) is mathematically expected DF.
일반적으로 DNA 염기서열은 임의 또는 이상적인 염기서열에 비교하여 그 디누클레오티드 빈도가 크게 또는 적게 표현된다. 본 연구에서 DOE (디누클레오티드의 기대 빈도 대 관찰 빈도의 비율)를 계산하여 본 결과, GC 함량과 정 또는 역으로 상관관계를 가지는 것으로 보여지며, 일반적으로 GC 함량 변화에 따라 그 값을 달리하였다. DOE-GC 분포는 종특이적이며, 일관된 경향성을 나타내었다. 이 경향에 따라 연구된 생물을 대략 두개의 집단, 즉 척추 동물과 비척추 동물로 나눌 수 있었다. 초파리 (D. melanogaster)의 디누클레오티드-특이적 돌연변이 압력은 대장균 (E. coli)과 유사한 것으로 추정되었다. DF (디누클레오티드의 빈도)와 GC 함량과의 관계도 또한 연구 되었다. DF-GC 분포의 임의 모형이 제시되었으며, 이 모형과 DOE를 이용하여 인간 모형이 예측되었고, 옳은 것으로 확인되었다. 대체적으로 자연계의 DNA 염기서열은, x가 GC 비율, $DF_e(x)$가 DF의 수학적 기대치라 할 때, $DF(x) = DOE(x) \cdot DF_e(x)$의 관계가 있었다.