XML adalah pendekatan utama menyediakan semantik untuk ilmu pengetahuan, seperti MathML , SBML / BIOPAX (biologi), GML dan KML(geo) SVG (grafis) dan NLM-DTD , ODT dan OOXML (dokumen). CML menyediakan dukungan untuk sebagian besar bidang kimia, terutama molekul, senyawa, reaksi, spektrum, kristal dan kimia komputasi (compchem).
CML telah dikembangkan oleh Peter Murray-Rust dan Henry Rzepa sejak tahun 1995 dan merupakan de facto XML untuk kimia diterima oleh penerbit dan memiliki lebih dari 1 juta baris kode Open Source mendukungnya. CML dapat divalidasi dan dibangun menjadi alat authoring (misalnya Kimia Add-in untuk Microsoft Word ).
Peter Murray-Rust dan Henry Rzepa
Infrastruktur mencakup konverter warisan, kamus, Semantic Web dan Data Terbuka Linked.
Ada beberapa versi dari skema CML. Rilis stabil terakhir adalah Skema 2,4 dan tetap tidak berubah sejak tahun 2005.
Skema terbaru adalah 3 versi beta . Seperti yang ditunjukkan oleh beta skema ini masih dalam pengembangan tapi pada dasarnya itu terdiri dari 2,4 Skema asli tetapi dengan model konten jauh berkurang. Hal ini memungkinkan pengguna untuk menempatkan bersama-sama elemen dan atribut dengan cara yang lebih fleksibel agar sesuai dengan data yang mereka ingin mewakili lebih mudah.
pada bagian tutorial :
1.Konvensi Molekuler
Konvensi molekuler digunakan untuk menentukan kimia yang berkaitan dengan molekul, misalnya koneksi tabel rumus, nama dan sifat. Molekul-molekul dapat juga mengandung spektrum meskipun ini akan memiliki konvensi sendiri tergantung pada apakah mereka Infra Red, NMR dll
Namespaces
Hal ini diasumsikan bahwa ruang nama berikut ini terikat pada prefiks berikut:
cml
= http://www.xml-cml.org/schema
conventions
= http://www.xml-cml.org/convention/
cmlDictionary
= http://www.xml-cml.org/dictionary/
Menentukan konvensi
Untuk menggunakan konvensi molekul yang Anda butuhkan untuk menggunakan convention
atribut. Hal ini dapat dilakukan di kedua cml
unsur atau molecule
unsur. Sebagai contoh:
<cml:cml convention='conventions:molecular'>
...
</ CML: CML>
atau
<cml:molecule convention='conventions:molecular' id='m1'>
...
</ CML: molekul>
Sebuah meja molekul koneksi
Koneksi tabel terdiri dari atom dan ikatan antara mereka. Untuk menentukan atom hidrogen di CML xml berikut digunakan:
<cml:atomArray>
<cml:atom id='a1' elementType='H' />
</ CML: atomArray>
2. Kimia Markup Language – Kamus Konvensi
8 April 2011
- Versi ini :
- http://www.xml-cml.org/convention/dictionary-20110525
- Versi terbaru:
- http://www.xml-cml.org/convention/dictionary
- Sebelumnya versi:
- http://www.xml-cml.org/convention/dictionary-20110408
- Penulis:
- Lihat pengakuan .
- Editor:
- Sam Adams, Universitas Cambridge
- Joe Townsend, Universitas Cambridge
Abstrak
Spesifikasi ini mendefinisikan persyaratan dari Bahasa Markup Kimia kamus konvensi.
Daftar isi
1. Pendahuluan
1.1 Notasi Konvensi
1.2 Namespace
2. Menerapkan konvensi kamus
3. Kamus Elemen
3.1 Namespace
3.2 Awalan
3.3 Judul
3.4 Deskripsi
3,5 Entri
4. Elemen Entry
4.1 Id
4.2 Jangka
4.3 Definisi
4.4 Deskripsi
4.5 Jenis data
4.6 Jenis Satuan
4,7 Default unit
5. Contoh Kamus
Lampiran
A. Referensi
B. Ucapan Terima Kasih
1. Pendahuluan
Kamus memungkinkan CML untuk dipahami oleh mesin. Banyak ilmu fisik dikelola melalui mekanisme kamus. Kami menemukan istilah dan unit yang berkaitan dengan aspek ilmu pengetahuan (seperti panas pembentukan, titik lebur, grup jalur) dan membuat entri untuk item ini dalam kamus.
Entri dapat terdiri dari hanya sebuah id unik (dalam namespace kamus) dan beberapa definisi manusia dimengerti namun kami sangat mendorong informasi lebih lanjut diberikan. Misalnya apa unit, ada atas dan batas bawah, apa jenis data (string, integer, dll float).
Program yang berbeda kadang-kadang menghasilkan data dengan label yang sama tetapi interpretasi yang berbeda; tidak berarti kepadatan kerapatan elektron atau kepadatan fisik? Oleh karena itu masing-masing kode kimia komputasi akan memiliki kamus sendiri dan kemudian masyarakat kemudian dapat memutuskan untuk grup tertentu konsep bersama.
Mana konsep ini didefinisikan oleh skema CML mereka TIDAK BOLEH ditentukan dengan menggunakan mekanisme kamus.
Dimana konsep-konsep yang didefinisikan oleh kamus baku entri-entri ini HARUS direferensikan, bukan mendefinisikan konsep dalam kamus lain.
1.1 Notasi Konvensi
Kata kunci “HARUS”, “TIDAK HARUS”, “REQUIRED”, “AKAN”, “TIDAK AKAN”, “HARUS”, “TIDAK HARUS”, “RECOMMENDED”, “MUNGKIN”, dan “OPTIONAL” dalam dokumen ini adalah untuk ditafsirkan seperti yang dijelaskan dalam RFC 2119 [ IETF RFC 2119 ].
Istilah “elemen”, “atribut”, “anak” dan “orang tua” dalam dokumen ini adalah untuk ditafsirkan seperti yang dijelaskan di Rekomendasi W3C Extensible Markup Language (XML) [ W3C XML ].
Penggunaan font adalah sebagai berikut:
- Skema istilah, termasuk elemen dan atribut, ditulis dalam
this font
.
1.2 Namespace
Spesifikasi ini menggunakan ruang nama berikut dan prefiks untuk menunjukkan mereka ruang nama:
Awalan |
Namespace URI |
Keterangan |
cml |
http://www.xml-cml.org/schema |
Kimia unsur Markup Language |
convention |
http://www.xml-cml.org/convention/ |
Standar Kimia Markup Language konvensi namespace |
xhtml |
http://www.w3.org/1999/xhtml |
XHTML |
2. Menerapkan konvensi kamus
Konvensi Kamus HARUS ditentukan dengan menggunakan convention
atribut pada baik cml
atau dictionary
elemen. Jika konvensi ditetapkan pada cml
maka elemen elemen yang HARUS mengandung elemen anak tunggal dalamhttp://www.xml-cml.org/schema
namespace, yang HARUS dictionary
elemen.
3. Kamus Elemen
3.1 Namespace
Para dictionary
elemen HARUS memiliki namespace
atribut, nilai yang HARUS URI yang valid mendefinisikan ruang lingkup di mana ketentuan entri yang unik. URI namespace kamus HARUS memutuskan untuk representasi dari kamus. URI namespace kamus HARUS berakhir dengan baik karakter ‘/’ atau karakter ‘#’ sehingga istilah dapat direferensikan oleh menambahkan mereka ke URI.
3.2 Awalan
Para dictionary
elemen HARUS memiliki dictionaryPrefix
atribut menetapkan prefiks standar yang digunakan ketika referensi entri kamus. ParadictionaryPrefix
HARUS prefiks QName XML yang valid, dan HARUS menjadi unik dalam domain CML.
3.3 Judul
Para dictionary
elemen HARUS memiliki title
atribut ditujukan untuk manusia-dibaca.
3.4 Deskripsi
Para dictionary
elemen HARUS memiliki satu description
elemen anak, yang isinya memberikan gambaran terbaca-manusia dari domain kamus. Paradescription
Unsur HARUS berisi elemen anak satu atau lebih dihttp://www.w3.org/1999/xhtml
namespace. Para description
Unsur TIDAK HARUS berisi elemen anak apapun tidak di http://www.w3.org/1999/xhtml
namespace.
3,5 Entri
Para dictionary
Unsur HARUS berisi satu anak bijih lebih entry
elemen, dan tidak HARUS mengandung elemen anak lainnya dari http://www.xml-cml.org/schema
namespace.
4. Elemen Entry
4.1 ID
Sebuah entry
elemen HARUS memiliki id
atribut, nilai yang HARUS unik dalam lingkup kamus.
Nilai id
atribut HARUS dimulai dengan huruf, dan hanya HARUS berisi huruf, angka, titik, tanda hubung atau garis bawah.
IdStartChar |
:: = |
[AZ] | [az] |
IdChar |
:: = |
IdStartChar | [0-9] | "." | "-" | "_" |
Id |
:: = |
IdStartChar (IdChar)* |
4.2 Jangka
Sebuah entry
elemen HARUS memiliki term
atribut, nilai yang memberikan frase bahasa nounal unik mengidentifikasi subjek entri.
Nilai term
atribut MUNGKIN mengandung karakter unicode yang valid, namun itu adalah bahwa setiap karakter RECOMMENDED dari luar subset ASCII (codepoints 32-127) diwakili menggunakan referensi entitas.
4.3 Definisi
Sebuah entry
HARUS berisi elemen tunggal definition
elemen anak, isi yang memberikan frase nounal mendefinisikan subjek masuk lebih verbosely dari istilah.
Para definition
Unsur HARUS berisi elemen anak satu atau lebih dihttp://www.w3.org/1999/xhtml
namespace. Para definition
Unsur TIDAK HARUS berisi elemen anak apapun tidak di http://www.w3.org/1999/xhtml
namespace.
4.4 Deskripsi
Sebuah entry
elemen MUNGKIN memiliki satu description
elemen anak, isi yang menyediakan informasi lebih lanjut mengenai istilah, termasuk, namun tidak terbatas pada: contoh, terbaca-manusia semantik dan hyperlink ke sumber daya lain yang bermanfaat.
Para description
Unsur HARUS berisi elemen anak satu atau lebih dihttp://www.w3.org/1999/xhtml
namespace. Para description
Unsur TIDAK HARUS berisi elemen anak apapun tidak di http://www.w3.org/1999/xhtml
namespace.
4.5 Jenis data
Ketika berlaku untuk konsep didefinisikan, sebuah entry
HARUS memilikidataType
atribut, nilai yang merupakan QName referensi tipe data nilai didefinisikan dengan menggunakan entry
.
Umum tipe data:
xsd:string
xsd:double
xsd:integer
xsd:boolean
4.6 Jenis Satuan
Sebuah entry
HARUS memiliki unitType
atribut, nilai yang merupakan QName referensi jenis unit (misalnya suhu) dari setiap nilai yang didefinisikan menggunakan entry
.
Sebuah entry
menggambarkan sebuah konsep yang tidak seharusnya unit; misalnya nama program harus memiliki unitType ada di CML standarunitType kamus .
4,7 Default unit
Ketika berlaku untuk konsep didefinisikan, sebuah entry
HARUS memilikiunits
atribut, nilai dari yang merupakan referensi QName unit default (misalnya Kelvin) dari setiap nilai yang didefinisikan menggunakan entry
.
Jika unitType
secara tegas diberikan sebagai tidak diketahui maka atribut unit TIDAK HARUS hadir.
Jika unitType
secara tegas diberikan sebagai tidak maka atribut unit HARUS hadir dan nilainya harus mengarah ke none # http://www.xml-cml.org/unit/si.
5. Contoh Kamus
<Xml version = "1.0" encoding = "UTF-8"??>
<Kamus xmlns = "http://www.xml-cml.org/schema"
xmlns: konvensi = "http://www.xml-cml.org/convention/"
xmlns: unit = "http://www.xml-cml.org/unit/nonSi/"
xmlns: unitType = "http://www.xml-cml.org/unit/unitType/"
xmlns: xhtml = "http://www.w3.org/1999/xhtml"
xmlns: xsd = "http://www.w3.org/2001/XMLSchema"
konvensi = "konvensi: kamus"
title = "konsep-konsep kimia dasar"
namespace = "http://www.xml-cml.org/dictionary/dummy/"
dictionaryPrefix = "dummy">
<description>
<xhtml:p>
Ini adalah contoh kamus
</ Xhtml: p>
</ Description>
<Entri id = "molecmass" Istilah = "Misa Molekuler"
dataType = "xsd: double" unitType = "unitType: jumlah" unit = "Unit: Dalton">
<definition>
<xhtml:p>
Massa satu mol suatu zat dalam satuan massa atom terpadu (Dalton).
</ Xhtml: p>
</ Definisi>
<description>
<xhtml:p>
Massa molekul (m) zat adalah massa satu molekul zat yang,
dalam satuan massa atom terpadu (s) u (sama dengan 1 / 12 massa satu atom
isotop karbon-12). Ini adalah numerik setara dengan massa molekul relatif
(Mr) dari molekul, sering disebut dengan istilah berat molekul, yang
merupakan rasio massa molekul yang untuk 1 / 12 massa karbon-12 dan merupakan
berdimensi nomor. Dengan demikian, adalah keliru untuk mengekspresikan massa
molekul relatif (berat molekul) di dalton (Da). Sayangnya, berat molekul dan
massa istilah molekuler telah bingung di berbagai situs, yang sering menyatakan
bahwa berat molekul digunakan di masa lalu sebagai istilah lain untuk massa
molekul.
</ Xhtml: p>
<xhtml:p>
Massa molekul berbeda dari pengukuran yang lebih umum dari massa bahan kimia,
seperti sebagai massa molar, dengan memperhatikan komposisi isotop molekul yang
agak daripada distribusi isotop molekul rata-rata banyak. Akibatnya massa,
molekul adalah jumlah lebih tepat daripada massa molar, namun lebih akurat untuk
menggunakan molar massa pada sampel massal. Ini berarti bahwa massa molar adalah
sesuai sebagian besar waktu kecuali ketika berhadapan dengan molekul tunggal.
</ Xhtml: p>
</ Description>
</ Entry>
<Entri id = "molarmass" Istilah = "Massa molar"
dataType = "xsd: double" unitType = "unitType: jumlah" unit = "Unit: Dalton">
<definition>
<xhtml:p>
Massa per jumlah substansi.
</ Xhtml: p>
</ Definisi>
<description>
<xhtml:p>
Massa molar, simbol M, merupakan karakteristik properti fisik dari zat yang
diberikan (Unsur kimia atau senyawa kimia), yaitu massa per jumlah substansi.
Unit dasar SI untuk massa adalah kilogram dan bahwa untuk jumlah zat adalah
mol. Dengan demikian, unit diturunkan untuk massa molar adalah kg / mol.
Namun, untuk kedua alasan praktis dan historis, massa molar hampir selalu
dikutip dalam gram per mol (g / mol atau g mol-1), khususnya dalam kimia.
</ Xhtml: p>
<xhtml:p>
Massa molar berkaitan erat dengan massa molar relatif (Mr) suatu senyawa,
yang tua berat rumus panjang dan massa atom standar konstituen
elemen. Namun, harus dibedakan dari massa molekul (juga
dikenal sebagai berat molekul), yang merupakan massa satu molekul (dari
setiap tunggal komposisi isotop) dan tidak langsung berhubungan dengan
massa atom, massa dari satu atom (dari setiap isotop tunggal). Para dalton,
simbol Da, juga kadang-kadang digunakan sebagai unit massa molar, terutama
dalam biokimia, dengan definisi 1 Da = 1 g / mol, meskipun fakta bahwa itu
adalah ketat unit massa molekul (1 Da = 1,660 538 782 (83) × 10-27 kg).
</ Xhtml: p>
</ Description>
</ Entry>
</ Kamus>
A. Referensi
- [RFC2119]
- IETF RFC 2119: Kata kunci untuk digunakan dalam RFC untuk Tunjukkan Tingkat Kebutuhan , S. Bradner, Maret 1997. Tersedia di http://www.ietf.org/rfc/rfc2119.txt.
- [XML]
- Extensible Markup Language (XML) 1.0 (Edisi Kelima) , T. Bray, J. Paoli, CM Sperberg-McQueen E. Maler dan F. Yergeau, Editor. World Wide Web Consortium. 26 Oktober 2008. Versi ini http://www.w3.org/TR/2008/REC-xml-20081126. versi terbaru dari XML tersedia di http://www.w3.org/TR/REC-xml.
B. Ucapan Terima Kasih
- Peter Murray-Rust
- Joe Townsend
- Nick Inggris
- Weerapong Phadungsukanan
- Daniel Lowe
- Sam Adams
- Hannah Barjat