Frage:
Wie viele einzigartige Moleküle existieren? Und wie viele existieren nur durch Synthese?
poshest
2014-10-01 19:38:57 UTC
view on stackexchange narkive permalink

Ich interessiere mich für

  • Wie viele einzigartige Moleküle (aller Art: organisch und anorganisch usw.) existieren auf der Welt, die für den Menschen zugänglich ist (lasst uns) Schwarze Löcher und die Zentren der Sterne usw. ausschließen?
  • Welche Untergruppe dieser unterschiedlichen Typen existiert nur aufgrund der Synthese durch den Menschen?

Um es einfacher zu machen, Ignorieren Sie Varianten wie Moleküle mit unterschiedlichen Atomisotopen und unterschiedlichen Bindungskonfigurationen (z. B. cis, trans). Z.B. Standardwasser und "schweres Wasser" sind beide $ \ ce {H2O} $ und zählen als eins.

Ich suche nach einer theoretischen Schätzung, daher sind nur Größenordnungen erforderlich. Ich suche nicht nach einer Anzahl von Datensätzen in einem Datenbankkatalog von Chemikalien.

Bitte erläutern Sie die Methoden zur Ermittlung Ihrer Schätzungen. Dies ist nicht wirklich hilfreich.

Ich kann mir gar nicht vorstellen, wie eine angemessene Antwort auf diese Frage angeboten werden kann. Angesichts der Weite des Universums und der Menge, die wir eigentlich nicht kennen, und angesichts der Vielzahl möglicher chemischer Umgebungen wäre es schwierig, diese Frage zu beantworten, ohne eine Vielzahl von groben Annäherungen vorzunehmen. Was meinst du mit * verschiedenen Typen *?
Definieren Sie "Arten von Molekülen".
Meinst du wie "organisch", "anorganisch", "biologisch" ...?
@LordStryker Ich weiß nicht, wie ich "verschiedene Moleküle" besser erklären kann, als das Beispiel in meiner Frage zu erweitern: H2O ist eines. O2 ist zwei. CO2 ist drei. Ethanol C2H6O ist vier. Methylparahydroxybenzoat CH3 (C6H4 (OH) COO) ist fünf ... Sinnvoll? Bezüglich "Weite" suche ich nur Größenordnungen.
@Wildcat hilft mein Beispiel für LordStryker? Was ist nicht klar?
@AngusTheMan, nein, keine Klassen oder allgemeinen Gruppen von Molekülen. Bitte beachten Sie meinen Kommentar zu LordStryker. Ist das sinnvoll?
@poshest, ist $ \ ce {SiO2} $ vom gleichen Typ wie $ \ ce {CO2} $?
@Wildcat-Nr. Sie zählen jeweils als eine in der Zählung. Ich denke, das Wort, das ich hätte verwenden sollen, waren "einzigartige" Moleküle, nicht "verschieden" (sorry, ich komme aus einer Datenbank).
@poshest, dann habe ich das Gefühl, dass Ihre Frage über die Anzahl der Moleküle mit unterschiedlichen * Molekülformeln * ist. Ich bezweifle, dass man das abschätzen kann.
Können wir fragen, was die Motivation für diese Frage ist? Anscheinend möchten Sie eine Schätzung der synthetischen Moleküle im Vergleich zu allen Molekülen. Warum? Neugier oder etwas anderes?
@trb456 Ja, ich schreibe eine Arbeit und wollte mit einigen Zahlen beginnen, um im Intro eine Perspektive zu geben. Es hat mich beunruhigt, dass es im Web nichts darüber gab. Aber Jerepierre gab mir den Geheimcode (Suchbegriff) "chemischer Raum"
Ich neige dazu, über 9000 zu schätzen.
Abhängig von der genauen Definition der Begriffe "Molekül" und "einzigartig" kann die Antwort entweder eine sehr große endliche Zahl oder [zählbare Unendlichkeit] (https://en.wikipedia.org/wiki/Countable_set) oder sogar sein [unzählige Unendlichkeit] (https://en.wikipedia.org/wiki/Uncountable_set).
Die Antwort ist wahrscheinlich unzählig groß (größer zum Beispiel die Anzahl der Teilchen im beobachtbaren Universum). Für einfache ungesättigte Kohlenwasserstoffe allein wird angenommen, dass die Anzahl der Strukturisomere 10 ^ 22 für nur 50 Kohlenstoffe überschreitet. Und das sind nur zwei Arten von Atomen mit Einschränkungen der Konnektivität. Die Möglichkeiten für mehr Atomtypen wachsen schneller als exponentiell. Und wir können längere Ketten machen.
@SherlockHolmes - meine genauere Schätzung liegt bei über 9001 ...
Sechs antworten:
#1
+25
Jason Patterson
2014-10-01 22:14:51 UTC
view on stackexchange narkive permalink

Polymere machen diese Frage mehr oder weniger unbeantwortbar.

Betrachten Sie das menschliche Chromosom 1, das etwa 249.000.000 Basenpaare enthält. Es gibt nichts, was besagt, dass wir diese Paare nicht so bestellen könnten, wie wir es möchten. Daher besteht für DNA allein in einer Menge, die in jedem Menschen auf der Erde vorhanden ist, die Möglichkeit für 4 sup> 249000000 sup> verschiedene Moleküle . Schließen Sie Dinge wie alternative Nukleotide (es sind mit ziemlicher Sicherheit mindestens Tausende davon möglich) und längere Ketten ein, und die Anzahl wird noch größer, und das schließt nur DNA (und nahe Verwandte) ein.

Es gibt keine echte Möglichkeit, alle einzubeziehen, da es eine enorme Anzahl von Möglichkeiten geben muss, diese Moleküle zusammenzusetzen, die wir noch nicht gefunden haben.

Wie viele gibt es? Sehr viele. Wie viele existieren nur in unseren Köpfen? Fast alle von ihnen (das Universum enthält schließlich nur etwa 10 sup> 80 sup> -Partikel.

Das ist eine gute Erklärung für ein theoretisches Maximum. Ich habe auf die gleiche Weise über DNA-Kombinationen nachgedacht. Können Sie die tatsächlich vorhandenen Zahlen genauer bestimmen als "sehr viel"? Irgendeine Vorstellung von dem Anteil derer, die nur existieren, weil sie von Menschen gemacht sind?
Ich denke, die Menge der Partikel ist im Universum sehr instabil. Weißt du, schwarze Löcher, schwarze Masse und so.
Schrecklich viel? Eigentlich meinst du unendlich. Es gibt keine Obergrenze für die Kettenlänge von Polymeren, daher ist ihre Anzahl selbst unendlich. Die einzige wirkliche obere Bindung ist die Größe des Universums und die Anzahl der Atome darin.
Nun, das gibt uns eine vernünftige Obergrenze. Jedes Atom ist an ein anderes Atom gebunden oder nicht, daher suchen wir nach Möglichkeiten, N = 10 ^ 80 Elemente zu partitionieren, dh die Obergrenze ist Bell (10 ^ 80) = e ^ (e ^ (10 ^ 80)). . Das Aufschreiben dieser Zahl ist in diesem Universum jedoch unmöglich, da sie mehr als 10 ^ 80 Ziffern (!) Enthält.
@Greg Wenn wir wählerisch sein wollen, wäre es nicht wirklich unendlich, aber es wird absurd groß. Ab einer bestimmten Grenze wird das Verhalten des Moleküls von Gravitationseffekten dominiert. Wenn Sie es groß genug machen, wird es zu einem Stern zusammenbrechen und mit der Fusion beginnen, wodurch die chemischen Bindungen durcheinander gebracht werden. Das Beste, was Sie für etwas tun könnten, das sich als einzelnes Molekül qualifizieren würde, wäre eine obere Massengrenze für einen weißen Zwergstern. Dadurch wird Ihre Kettenlänge auf insgesamt etwa 10 ^ 57 Atome begrenzt. Es gibt unzählige Möglichkeiten, diese zu arrangieren, aber es ist nicht unendlich. Ich liebe dieses Zeug ...
@JasonPatterson Sie sind richtig. Es ist auch eine interessante nicht-chemische Art der oberen Bindung.
#2
+13
jerepierre
2014-10-02 04:15:42 UTC
view on stackexchange narkive permalink

Ohne Einschränkung der Anzahl der Atome / des Molekulargewichts ist die Anzahl der möglichen theoretischen Verbindungen aus dem von Jason Patterson angegebenen Grund unendlich: Sie können ein Polymer immer um eine weitere Einheit verlängern.

Es wurde geschätzt, dass es 10 ^ 60 mögliche organische Verbindungen mit einem Molekulargewicht von weniger als 500 gibt. Die Kunst und Praxis des strukturbasierten Wirkstoffdesigns: eine molekulare Modellierungsperspektive. CAS mag Duplikate haben, aber es ist immer noch die beste Datenbank aller bekannten Verbindungen in der Literatur und dennoch nicht umfassend. Fast die gesamte CAS-Datenbank ist vollständig synthetisch. Eine Suche nach Einträgen in CAS mit dem Molekulargewicht <500 ergibt 61.026.438 Treffer, etwa die Hälfte der gesamten Datenbank. Die obige Referenz legt nahe, dass Leben mit einigen tausend kleinen Molekülen existieren kann (d. H. Verbindungen mit dem Molekulargewicht <500). Die Natur produziert weit mehr Verbindungen als das absolute Minimum, aber ich gehe davon aus, dass wir nur die Oberfläche dessen gekratzt haben, was da draußen ist.

Das sollte Ihnen eine Vorstellung von den Größenordnungen geben, über die wir sprechen. Beachten Sie, dass die Zahlen exponentiell ansteigen werden, wenn die Beschränkung von MW < 500 gelockert wird. Kurz gesagt, Chemiker haben buchstäblich Millionen verschiedener Verbindungen synthetisiert, aber im Wesentlichen keine im Verhältnis zu den Möglichkeiten.

Ich schlage vor, dass Sie das Thema "chemischer Raum" untersuchen, wenn Sie mehr über diesen Bereich erfahren möchten.

Ich denke, die Schichtung in Molekulargewichte ist ein guter Weg, um das Problem zu lösen. Wer hat die 10 ^ 60 geschätzt? Und wie? Ich habe das Buch leider nicht. +1 auch für "chemischer Raum"! Die magische Suchformel! :) :)
Dies hat einige Verweise auf Ihre Zahlen und viele andere gute Sachen http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3447393/
Reymond (im obigen Link) schlug die 10 ^ 60 vor, aber andere haben zugestimmt, dass die Zahl wahrscheinlich in diesem Bereich liegt. Diese Fragen fallen normalerweise in den Bereich der Cheminformatik.
#3
+5
iad22agp
2014-10-01 21:02:28 UTC
view on stackexchange narkive permalink

Laut dem Chemical Abstracts Service enthält CAS REGISTRY (SM) mehr als 90 Millionen einzigartige organische und anorganische chemische Substanzen wie Legierungen, Koordinationsverbindungen, Mineralien, Gemische, Polymere und Salze mehr als 65 Millionen Sequenzen - mehr als jede andere Datenbank dieser Art. Es enthält Substanzen, über die in der Literatur bereits im frühen 19. Jahrhundert berichtet wurde, und wird täglich mit etwa 15.000 Substanzen aktualisiert.

Das CAS-Register enthält keine Substanzen, an die noch gedacht oder entdeckt werden muss. Es enthält in der Tat Ihre fünf Beispiele.

Dies ist ungefähr so ​​nah an einer Antwort, wie ich mir vorstellen kann.

Nun, ich habe ausdrücklich nicht um eine "Anzahl von Datensätzen in einem Datenbankkatalog von Chemikalien" gebeten, aber ich schätze Ihre Antwort. Gibt es eine Möglichkeit, den Anteil von CAS zu ermitteln, der völlig unnatürliche (synthetische) Moleküle umfasst?
Ich denke, der Anteil natürlich vorkommender Substanzen macht einen relativ geringen Anteil an der Gesamtmenge aus. Meine Argumentation: Beachten Sie, dass viele Substanzen in der Natur existieren, aber nicht sehr viele in der Natur in reiner Massenform. Beachten Sie auch, dass "Naturstoffchemie" eine Spezialität in der organischen Chemie ist, die sich mit Substanzen befasst, die in lebenden Organismen produziert werden. Es gibt viele Naturprodukte, die noch nicht entdeckt wurden - aber dies ist immer noch eine kleine Untergruppe möglicher Substanzen.
#4
+3
Ellert van Koperen
2014-10-02 03:16:07 UTC
view on stackexchange narkive permalink

In einer Datenbank mit derzeit verfügbaren synthetischen Verbindungen, die ich erstellt habe, stehen 9,8 Millionen synthetische und natürliche Verbindungen zum Kauf zur Verfügung sowie weitere 27 Millionen Verbindungen, von denen die Anbieter glauben, dass sie bei Bedarf hergestellt werden können.

Dies schließt explizit nur reine Verbindungen ein, die durch Zeichnen einer Struktur beschrieben werden können, also keine Gemische und keine Dinge wie DNA, bei denen Sie nur die genaue Struktur erraten können.

Ich habe nur etwa 30 vertrauenswürdige Anbieter eingeschlossen, und Dieses Set ist speziell nicht dasselbe wie das CAS-Register, wohlgemerkt, da dieses sehr stark mit Unmengen von Duplikaten und Variationen in der Notation verschmutzt ist. Gut zu wissen: Fast alle Anbieter lügen über die Anzahl der Verbindungen, die sie haben.

Hast du das gebaut? Gute Arbeit! Die Alibaba der Chemikalien. :) Dies ist ein großer Winkel zu den Handelszahlen. Irgendeine Idee, welcher Anteil nur synthetisch existiert?
Vielen Dank für das Kompliment :-) Die natürlichen Verbindungen können entweder so synthetisiert werden, wie sie in der Natur sind, oder tatsächlich aus einer natürlichen Quelle herausgefiltert werden. Dennoch ist dies nur ein sehr kleiner Teil der insgesamt verfügbaren Verbindungen. Ich habe keine Zählung zur Hand, aber ich würde sagen, eine Obergrenze von 5% wäre sehr königlich. Von allen anderen könnten die meisten Verbindungen zufällig sein , existieren 'in freier Wildbahn' in sehr sehr kleinen Mengen. Es gibt also unsere nächste Definitionshürde: Wann erklären Sie, dass eine Verbindung in der Natur „existiert“? Wenn Sie ein Molekül haben?
Hast du einen Link? Ist es online verfügbar?
Es ist leider nicht online verfügbar. Diese Daten stellen eine Menge Arbeit und Tools dar, die auch nicht kostenlos sind.
#5
+1
AkiraAiren
2017-11-22 20:15:03 UTC
view on stackexchange narkive permalink

Sie müssen nicht zu Polymeren gehen. Sie können bereits eine große Menge von Molekülen im Bereich kleiner Moleküle erzeugen (MW < 900 Da). Es ist ein interessantes Gebiet, da die meisten heutigen Medikamente kleine Moleküle sind.

Hier ist der Link zu einer Forschungsgruppe in Bern, Schweiz, die virtuelle Verbindungen auflistet und versucht, sie in viele verschiedene Kategorien einzuteilen. Eine davon ist die synthetische Verfügbarkeit.

Hier erklären sie, was sie tun

Hier sind die Tools, die sie anbieten

Sie haben viele Werkzeuge mit ausgefallener Visualisierung für einige. Viel Spaß beim Spielen.

#6
  0
wis
2015-11-24 16:24:40 UTC
view on stackexchange narkive permalink
  1. Wählen Sie eine Obergrenze für die Anzahl der Atome in einem Molekül. (zB max_a = 500)
  2. Wählen Sie aus, welches der atomaren Elemente Sie zulassen möchten (z. B. els = 1..92).
  3. Wählen Sie ein Atom aus der els-Liste aus.
  4. Welche mögliche Anzahl von Bindungen kann dieser Atomtyp eingehen (z. B. b_el1 = {2,3,4})?
  5. Wählen Sie aus, wie viele Bindungen in diesem Fall vorhanden sind (z. B. current_b = 3)
  6. Wählen Sie die nächste Bindungsnummer aus (bond_num = 1 in der ersten Iteration).
  7. Wählen Sie das nächste Add-On-Atom aus der anderen Liste aus, das an die aktuelle Bond-Nummer angehängt werden soll.
  8. Überprüfen Sie das Add-On-Atom auf Kompatibilität : Bindungstyp, verfügbare Elektronen, Raumanpassung
  9. Wenn alle Tests bestanden wurden, dann Add-On. Index-Atomzähler +1.
  10. Wenn nicht bestanden, kehren Sie zu Schritt 7 zurück.
  11. Wenn bestanden, kehren Sie zu Schritt 6 zurück.
  12. Wenn alle Bindungen voll sind, kehren Sie zurück zu Schritt 7
  13. Wenn der Atomzähler max_atoms überschreitet, STOP
  14. Beseitigen Sie Redundanzen (die dem Quant von Termini-1 entsprechen)
  15. ol>

    Für alle mit Durch den Zugriff auf Reaktionskompatibilitätsdaten generiert dieser Algorithmus die Gesamtzahl der möglichen Moleküle bis zu einem bestimmten Grenzwert. Nicht alle Details werden für ein "umfassendes Suchverfahren" bereitgestellt, z. B. die Verfolgung aller Zweige und den Umgang mit Doppelbindungen. Diese können jedoch auf einfache Weise hinzugefügt werden. Die Funktion "Limit festlegen" ist erforderlich, um zu vermeiden, dass Ihr Computer Jahrtausende lang an Zahlen arbeitet.

Dies beantwortet die Frage nicht wirklich, was ohnehin sehr schwer zu beantworten ist. Außerdem ist die Implementierung dieses Algorithmus viel schwieriger, als Sie sich vorstellen können. Zum Beispiel ist "Add-On-Atom auf Kompatibilität prüfen: Bindungstyp, verfügbare Elektronen, Raumanpassung" eine höchst nicht triviale Aufgabe, und es stellt sich auch die Frage, wie kompatibel "kompatibel" ist.
Dieser Algorithmus kann auch keine Ringe erstellen. Ringe und verschmolzene Ringe machen den größten Teil der natürlichen Verbindungen auf Kohlenstoffbasis aus.


Diese Fragen und Antworten wurden automatisch aus der englischen Sprache übersetzt.Der ursprüngliche Inhalt ist auf stackexchange verfügbar. Wir danken ihm für die cc by-sa 3.0-Lizenz, unter der er vertrieben wird.
Loading...