Informationssicherung Synthetische Moleküle speichern Daten sicher und dauerhaft

Quelle: Gesellschaft Deutscher Chemiker 2 min Lesedauer

Anbieter zum Thema

Wie es scheint, reichen übliche Speichermedien irgendwann nicht mehr aus, um den Wust an Informationen zu sichern, der auf uns zukommt. Forscher setzen deshalb auf die Datenspeicherung durch Moleküle.

Makromoleküle (Symbolbild) sind nicht nur als Kunststoff eine Klasse für sich. Denn in Zeiten von immer größer werdenden Datenmengen, die auch noch langfristig und sicher gespeichert werden müssen, könnten sie die Art des Speicherns von Daten verändern ...(Bild:  K. Nüppler)
Makromoleküle (Symbolbild) sind nicht nur als Kunststoff eine Klasse für sich. Denn in Zeiten von immer größer werdenden Datenmengen, die auch noch langfristig und sicher gespeichert werden müssen, könnten sie die Art des Speicherns von Daten verändern ...
(Bild: K. Nüppler)

Täglich fallen Daten an – Tendenz steigend! Das passiert im Rahmen geschäftlicher Transaktionen, durch Prozessüberwachung, Qualitätssicherung oder aufgrund der Forderung nach Rückverfolgbarkeit von Produktions-Chargen. Und ihre Archivierung, die über Jahrzehnte verlangt wird, benötigt viel Speicherplatz, aber auch Energie. Vor allem für die langfristige Archivierung großer Datenmengen, auf die nur selten zugegriffen werden müsse, seien aber zum Beispiel Makromoleküle mit definierter Sequenz (wie bei der DNA) und synthetische Polymere eine interessante Alternative, glauben die Experten des Fachbereichs Chemie der Seoul National University.

Zu lösende Probleme bei der molekularen Datenspeicherung

Im Vergleich zur DNA bieten synthetische Polymere aber einige Vorteile. Dazu gehören etwa eine einfache Synthese, eine höhere Speicherdichte sowie eine bessere Stabilität unter rauen Umgebungsbedingungen, wie die Koreaner erklären. Der Nachteil ist aber, dass die in Polymeren kodierte Information durch Massenspektrometrie (MS) respektive Tandem-Massen-Sequenzierung (MS2) ausgelesen wird. Aber dafür dürfen die Moleküle nicht zu groß werden, was die Speicherkapazität pro Makromolekülkette stark beschränkt. Außerdem werde die komplette Kette Baustein für Baustein ausgelesen. Es könne dabei nicht direkt und wahllos auf Bits zugegriffen werden, für die man sich mal eben interessiert. Das ist so, als ob man ein Buch statt auf der relevanten Seite etwas nachzusehen, komplett durchlesen muss, veranschaulichen die Experten. Lange DNA-Ketten könnten dagegen in Fragmente zufälliger Länge zerlegt, einzeln sequenziert und rechnerisch zur Gesamtsequenz rekonstruiert werden. Das Team entwickelt deshalb einen neuen Ansatz, mit dem auch sehr lange synthetische Polymerketten, deren Molekulargewichte die analytische Grenze der MS beziehungsweise der MS2 deutlich überschreiten, effizient ausgelesen werden können.

So überwindet man die Längenbegrenzung

Als Beispiel codierten sie ihre Universitätsadresse als ASCII-Code und übersetzten diesen zusammen mit einem Fehler-Detektions-Code (CRC ist ein gängiges Verfahren zur Prüfung der Datenintegrität) in einen Binärcode. Das heißt, eine Abfolge von 1 und 0. Die so erzeugte 512-Bit-Information speicherten sie in einer Polymerkette aus zwei verschiedenen Monomeren – Milchsäure codiert 1 und Phenyl-Milchsäure 0. An unregelmäßigen Stellen bauten sie noch Mandelsäure enthaltende Fragmentierungscodes ein. Bei chemischer Aktivierung werden die Ketten dort gespalten. Im Beispiel in 18 verschieden große Fragmente, die einzeln durch MS2-Sequenzierung entschlüsselt werden können. Eine speziell entwickelte Software identifiziert die Fragmente dann zunächst anhand ihrer Masse sowie ihrer Endgruppen aus den MS-Spektren. Während der MS2 „zerbrechen“ bereits gemessene Molekülionen weiter. Ihre Bruchstücke werden erneut analysiert. Anhand deren Massendifferenzen lassen sich die Fragmente sequenzieren. Per CRC rekonstruiert die Software daraus die Sequenz der gesamten Kette. Damit ist die Längenlimitierung für Polymerketten überwunden.

Auch einzelne Bits sind sequenzierbar

Außerdem gelang es dem Team, interessierende Bits auch ohne Sequenzierung der gesamten Polymerkette auszulesen (Random Access) – etwa das Wort „Chemistry“ aus dem Code für die Universitätsadresse. Unter Berücksichtigung, dass alle Teile der Adresse durch Kommas getrennt und in einer bestimmten Reihenfolge angeordnet sind (Abteilung, Institution, Stadt, Postleitzahl, Land), ließ sich die Stelle eingrenzen, an der die gesuchte Information innerhalb der Kette gespeichert ist. Nur die relevanten Fragmente werden sequenziert.

(ID:50230466)

Jetzt Newsletter abonnieren

Verpassen Sie nicht unsere besten Inhalte

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung