XML adalah pendekatan utama menyediakan semantik untuk ilmu pengetahuan, seperti MathML , SBML / BIOPAX (biologi), GML dan KML(geo) SVG (grafis) dan NLM-DTD , ODT dan OOXML (dokumen). CML menyediakan dukungan untuk sebagian besar bidang kimia, terutama molekul, senyawa, reaksi, spektrum, kristal dan kimia komputasi (compchem).

CML telah dikembangkan oleh Peter Murray-Rust dan Henry Rzepa sejak tahun 1995 dan merupakan de facto XML untuk kimia diterima oleh penerbit dan memiliki lebih dari 1 juta baris kode Open Source mendukungnya. CML dapat divalidasi dan dibangun menjadi alat authoring (misalnya Kimia Add-in untuk Microsoft Word ).

Peter Murray-Rust dan Henry Rzepa

Infrastruktur mencakup konverter warisan, kamus, Semantic Web dan Data Terbuka Linked.

Ada beberapa versi dari skema CML. Rilis stabil terakhir adalah Skema 2,4 dan tetap tidak berubah sejak tahun 2005.

Skema terbaru adalah 3 versi beta . Seperti yang ditunjukkan oleh beta skema ini masih dalam pengembangan tapi pada dasarnya itu terdiri dari 2,4 Skema asli tetapi dengan model konten jauh berkurang. Hal ini memungkinkan pengguna untuk menempatkan bersama-sama elemen dan atribut dengan cara yang lebih fleksibel agar sesuai dengan data yang mereka ingin mewakili lebih mudah.

pada bagian tutorial :

1.Konvensi Molekuler

Konvensi molekuler digunakan untuk menentukan kimia yang berkaitan dengan molekul, misalnya koneksi tabel rumus, nama dan sifat. Molekul-molekul dapat juga mengandung spektrum meskipun ini akan memiliki konvensi sendiri tergantung pada apakah mereka Infra Red, NMR dll

Namespaces

Hal ini diasumsikan bahwa ruang nama berikut ini terikat pada prefiks berikut:

Menentukan konvensi

Untuk menggunakan konvensi molekul yang Anda butuhkan untuk menggunakan convention atribut. Hal ini dapat dilakukan di kedua cml unsur atau molecule unsur. Sebagai contoh:

 <cml:cml convention='conventions:molecular'>
	 ...
 </ CML: CML>

atau

 <cml:molecule convention='conventions:molecular' id='m1'>
	 ...
 </ CML: molekul>

Sebuah meja molekul koneksi

Koneksi tabel terdiri dari atom dan ikatan antara mereka. Untuk menentukan atom hidrogen di CML xml berikut digunakan:

 <cml:atomArray>
	 <cml:atom id='a1' elementType='H' />
 </ CML: atomArray>

2. Kimia Markup Language – Kamus Konvensi

8 April 2011

Versi ini :
http://www.xml-cml.org/convention/dictionary-20110525
Versi terbaru:
http://www.xml-cml.org/convention/dictionary
Sebelumnya versi:
http://www.xml-cml.org/convention/dictionary-20110408
Penulis:
Lihat pengakuan .
Editor:
Sam Adams, Universitas Cambridge
Joe Townsend, Universitas Cambridge

Abstrak

Spesifikasi ini mendefinisikan persyaratan dari Bahasa Markup Kimia kamus konvensi.


Daftar isi

1. Pendahuluan
1.1 Notasi Konvensi
1.2 Namespace
2. Menerapkan konvensi kamus
3. Kamus Elemen
3.1 Namespace
3.2 Awalan
3.3 Judul
3.4 Deskripsi
3,5 Entri
4. Elemen Entry
4.1 Id
4.2 Jangka
4.3 Definisi
4.4 Deskripsi
4.5 Jenis data
4.6 Jenis Satuan
4,7 Default unit
5. Contoh Kamus

Lampiran

A. Referensi
B. Ucapan Terima Kasih


1. Pendahuluan

Kamus memungkinkan CML untuk dipahami oleh mesin. Banyak ilmu fisik dikelola melalui mekanisme kamus. Kami menemukan istilah dan unit yang berkaitan dengan aspek ilmu pengetahuan (seperti panas pembentukan, titik lebur, grup jalur) dan membuat entri untuk item ini dalam kamus.

Entri dapat terdiri dari hanya sebuah id unik (dalam namespace kamus) dan beberapa definisi manusia dimengerti namun kami sangat mendorong informasi lebih lanjut diberikan. Misalnya apa unit, ada atas dan batas bawah, apa jenis data (string, integer, dll float).

Program yang berbeda kadang-kadang menghasilkan data dengan label yang sama tetapi interpretasi yang berbeda; tidak berarti kepadatan kerapatan elektron atau kepadatan fisik? Oleh karena itu masing-masing kode kimia komputasi akan memiliki kamus sendiri dan kemudian masyarakat kemudian dapat memutuskan untuk grup tertentu konsep bersama.

Mana konsep ini didefinisikan oleh skema CML mereka TIDAK BOLEH ditentukan dengan menggunakan mekanisme kamus.

Dimana konsep-konsep yang didefinisikan oleh kamus baku entri-entri ini HARUS direferensikan, bukan mendefinisikan konsep dalam kamus lain.

1.1 Notasi Konvensi

Kata kunci “HARUS”, “TIDAK HARUS”, “REQUIRED”, “AKAN”, “TIDAK AKAN”, “HARUS”, “TIDAK HARUS”, “RECOMMENDED”, “MUNGKIN”, dan “OPTIONAL” dalam dokumen ini adalah untuk ditafsirkan seperti yang dijelaskan dalam RFC 2119 [ IETF RFC 2119 ].

Istilah “elemen”, “atribut”, “anak” dan “orang tua” dalam dokumen ini adalah untuk ditafsirkan seperti yang dijelaskan di Rekomendasi W3C Extensible Markup Language (XML) [ W3C XML ].

Penggunaan font adalah sebagai berikut:

  • Skema istilah, termasuk elemen dan atribut, ditulis dalam this font .

1.2 Namespace

Spesifikasi ini menggunakan ruang nama berikut dan prefiks untuk menunjukkan mereka ruang nama:

Awalan Namespace URI Keterangan
cml http://www.xml-cml.org/schema Kimia unsur Markup Language
convention http://www.xml-cml.org/convention/ Standar Kimia Markup Language konvensi namespace
xhtml http://www.w3.org/1999/xhtml XHTML

2. Menerapkan konvensi kamus

Konvensi Kamus HARUS ditentukan dengan menggunakan convention atribut pada baik cml atau dictionary elemen. Jika konvensi ditetapkan pada cmlmaka elemen elemen yang HARUS mengandung elemen anak tunggal dalamhttp://www.xml-cml.org/schema namespace, yang HARUS dictionary elemen.

3. Kamus Elemen

3.1 Namespace

Para dictionary elemen HARUS memiliki namespace atribut, nilai yang HARUS URI yang valid mendefinisikan ruang lingkup di mana ketentuan entri yang unik. URI namespace kamus HARUS memutuskan untuk representasi dari kamus. URI namespace kamus HARUS berakhir dengan baik karakter ‘/’ atau karakter ‘#’ sehingga istilah dapat direferensikan oleh menambahkan mereka ke URI.

3.2 Awalan

Para dictionary elemen HARUS memiliki dictionaryPrefix atribut menetapkan prefiks standar yang digunakan ketika referensi entri kamus. ParadictionaryPrefix HARUS prefiks QName XML yang valid, dan HARUS menjadi unik dalam domain CML.

3.3 Judul

Para dictionary elemen HARUS memiliki title atribut ditujukan untuk manusia-dibaca.

3.4 Deskripsi

Para dictionary elemen HARUS memiliki satu description elemen anak, yang isinya memberikan gambaran terbaca-manusia dari domain kamus. Paradescription Unsur HARUS berisi elemen anak satu atau lebih dihttp://www.w3.org/1999/xhtml namespace. Para description Unsur TIDAK HARUS berisi elemen anak apapun tidak di http://www.w3.org/1999/xhtmlnamespace.

3,5 Entri

Para dictionary Unsur HARUS berisi satu anak bijih lebih entry elemen, dan tidak HARUS mengandung elemen anak lainnya dari http://www.xml-cml.org/schema namespace.

4. Elemen Entry

4.1 ID

Sebuah entry elemen HARUS memiliki id atribut, nilai yang HARUS unik dalam lingkup kamus.

Nilai id atribut HARUS dimulai dengan huruf, dan hanya HARUS berisi huruf, angka, titik, tanda hubung atau garis bawah.

IdStartChar :: = [AZ] | [az]
IdChar :: = IdStartChar | [0-9] | "." | "-" | "_"
Id :: = IdStartChar (IdChar)*

4.2 Jangka

Sebuah entry elemen HARUS memiliki term atribut, nilai yang memberikan frase bahasa nounal unik mengidentifikasi subjek entri.

Nilai term atribut MUNGKIN mengandung karakter unicode yang valid, namun itu adalah bahwa setiap karakter RECOMMENDED dari luar subset ASCII (codepoints 32-127) diwakili menggunakan referensi entitas.

4.3 Definisi

Sebuah entry HARUS berisi elemen tunggal definition elemen anak, isi yang memberikan frase nounal mendefinisikan subjek masuk lebih verbosely dari istilah.

Para definition Unsur HARUS berisi elemen anak satu atau lebih dihttp://www.w3.org/1999/xhtml namespace. Para definition Unsur TIDAK HARUS berisi elemen anak apapun tidak di http://www.w3.org/1999/xhtmlnamespace.

4.4 Deskripsi

Sebuah entry elemen MUNGKIN memiliki satu description elemen anak, isi yang menyediakan informasi lebih lanjut mengenai istilah, termasuk, namun tidak terbatas pada: contoh, terbaca-manusia semantik dan hyperlink ke sumber daya lain yang bermanfaat.

Para description Unsur HARUS berisi elemen anak satu atau lebih dihttp://www.w3.org/1999/xhtml namespace. Para description Unsur TIDAK HARUS berisi elemen anak apapun tidak di http://www.w3.org/1999/xhtmlnamespace.

4.5 Jenis data

Ketika berlaku untuk konsep didefinisikan, sebuah entry HARUS memilikidataType atribut, nilai yang merupakan QName referensi tipe data nilai didefinisikan dengan menggunakan entry .

Umum tipe data:

  • xsd:string
  • xsd:double
  • xsd:integer
  • xsd:boolean

4.6 Jenis Satuan

Sebuah entry HARUS memiliki unitType atribut, nilai yang merupakan QName referensi jenis unit (misalnya suhu) dari setiap nilai yang didefinisikan menggunakan entry .

Sebuah entry menggambarkan sebuah konsep yang tidak seharusnya unit; misalnya nama program harus memiliki unitType ada di CML standarunitType kamus .

4,7 Default unit

Ketika berlaku untuk konsep didefinisikan, sebuah entry HARUS memilikiunits atribut, nilai dari yang merupakan referensi QName unit default (misalnya Kelvin) dari setiap nilai yang didefinisikan menggunakan entry .

Jika unitType secara tegas diberikan sebagai tidak diketahui maka atribut unit TIDAK HARUS hadir.

Jika unitType secara tegas diberikan sebagai tidak maka atribut unit HARUS hadir dan nilainya harus mengarah ke none # http://www.xml-cml.org/unit/si.

5. Contoh Kamus

 <Xml version = "1.0" encoding = "UTF-8"??>
 <Kamus xmlns = "http://www.xml-cml.org/schema"
             xmlns: konvensi = "http://www.xml-cml.org/convention/"
             xmlns: unit = "http://www.xml-cml.org/unit/nonSi/"
             xmlns: unitType = "http://www.xml-cml.org/unit/unitType/"
             xmlns: xhtml = "http://www.w3.org/1999/xhtml"
             xmlns: xsd = "http://www.w3.org/2001/XMLSchema"
             konvensi = "konvensi: kamus"
             title = "konsep-konsep kimia dasar"
             namespace = "http://www.xml-cml.org/dictionary/dummy/"
             dictionaryPrefix = "dummy">
         <description>
             <xhtml:p>
                 Ini adalah contoh kamus
             </ Xhtml: p>
         </ Description>

     <Entri id = "molecmass" Istilah = "Misa Molekuler"
dataType = "xsd: double" unitType = "unitType: jumlah" unit = "Unit: Dalton">
         <definition>
             <xhtml:p>
Massa satu mol suatu zat dalam satuan massa atom terpadu (Dalton).
             </ Xhtml: p>
         </ Definisi>
         <description>
             <xhtml:p>
Massa molekul (m) zat adalah massa satu molekul zat yang,
dalam satuan massa atom terpadu (s) u (sama dengan 1 / 12 massa satu atom
isotop karbon-12).  Ini adalah numerik setara dengan massa molekul relatif
(Mr) dari molekul, sering disebut dengan istilah berat molekul, yang
merupakan rasio massa molekul yang untuk 1 / 12 massa karbon-12 dan merupakan
berdimensi nomor.  Dengan demikian, adalah keliru untuk mengekspresikan massa
molekul relatif (berat molekul) di dalton (Da).  Sayangnya, berat molekul dan
massa istilah molekuler telah bingung di berbagai situs, yang sering menyatakan
bahwa berat molekul digunakan di masa lalu sebagai istilah lain untuk massa
molekul.
             </ Xhtml: p>
             <xhtml:p>
Massa molekul berbeda dari pengukuran yang lebih umum dari massa bahan kimia,
seperti sebagai massa molar, dengan memperhatikan komposisi isotop molekul yang
agak daripada distribusi isotop molekul rata-rata banyak.  Akibatnya massa,
molekul adalah jumlah lebih tepat daripada massa molar, namun lebih akurat untuk
menggunakan molar massa pada sampel massal.  Ini berarti bahwa massa molar adalah
sesuai sebagian besar waktu kecuali ketika berhadapan dengan molekul tunggal.
             </ Xhtml: p>
         </ Description>
     </ Entry>

     <Entri id = "molarmass" Istilah = "Massa molar"
dataType = "xsd: double" unitType = "unitType: jumlah" unit = "Unit: Dalton">
         <definition>
             <xhtml:p>
                 Massa per jumlah substansi.
             </ Xhtml: p>
         </ Definisi>
         <description>
             <xhtml:p>
Massa molar, simbol M, merupakan karakteristik properti fisik dari zat yang
diberikan (Unsur kimia atau senyawa kimia), yaitu massa per jumlah substansi.
Unit dasar SI untuk massa adalah kilogram dan bahwa untuk jumlah zat adalah
mol.  Dengan demikian, unit diturunkan untuk massa molar adalah kg / mol.
Namun, untuk kedua alasan praktis dan historis, massa molar hampir selalu
dikutip dalam gram per mol (g / mol atau g mol-1), khususnya dalam kimia.
             </ Xhtml: p>
             <xhtml:p>
Massa molar berkaitan erat dengan massa molar relatif (Mr) suatu senyawa,
yang tua berat rumus panjang dan massa atom standar konstituen
elemen.  Namun, harus dibedakan dari massa molekul (juga
dikenal sebagai berat molekul), yang merupakan massa satu molekul (dari
setiap tunggal komposisi isotop) dan tidak langsung berhubungan dengan
massa atom, massa dari satu atom (dari setiap isotop tunggal).  Para dalton,
simbol Da, juga kadang-kadang digunakan sebagai unit massa molar, terutama
dalam biokimia, dengan definisi 1 Da = 1 g / mol, meskipun fakta bahwa itu
adalah ketat unit massa molekul (1 Da = 1,660 538 782 (83) × 10-27 kg).
             </ Xhtml: p>
         </ Description>
     </ Entry>

 </ Kamus>

A. Referensi

[RFC2119]
IETF RFC 2119: Kata kunci untuk digunakan dalam RFC untuk Tunjukkan Tingkat Kebutuhan , S. Bradner, Maret 1997. Tersedia di http://www.ietf.org/rfc/rfc2119.txt.
[XML]
Extensible Markup Language (XML) 1.0 (Edisi Kelima) , T. Bray, J. Paoli, CM Sperberg-McQueen E. Maler dan F. Yergeau, Editor. World Wide Web Consortium. 26 Oktober 2008. Versi ini http://www.w3.org/TR/2008/REC-xml-20081126. versi terbaru dari XML tersedia di http://www.w3.org/TR/REC-xml.

B. Ucapan Terima Kasih

  • Peter Murray-Rust
  • Joe Townsend
  • Nick Inggris
  • Weerapong Phadungsukanan
  • Daniel Lowe
  • Sam Adams
  • Hannah Barjat