Refine
Document Type
- Conference proceeding (2)
- Doctoral Thesis (1)
Is part of the Bibliography
- yes (3) (remove)
Institute
- Technik (2)
- Informatik (1)
Publisher
- Technische Universität Darmstadt (3) (remove)
Over the last decades, a tremendous change toward using information technology in almost every daily routine of our lives can be perceived in our society, entailing an incredible growth of data collected day-by-day on Web, IoT, and AI applications.
At the same time, magneto-mechanical HDDs are being replaced by semiconductor storage such as SSDs, equipped with modern Non-Volatile Memories, like Flash, which yield significantly faster access latencies and higher levels of parallelism. Likewise, the execution speed of processing units increased considerably as nowadays server architectures comprise up to multiple hundreds of independently working CPU cores along with a variety of specialized computing co-processors such as GPUs or FPGAs.
However, the burden of moving the continuously growing data to the best fitting processing unit is inherently linked to today’s computer architecture that is based on the data-to-code paradigm. In the light of Amdahl's Law, this leads to the conclusion that even with today's powerful processing units, the speedup of systems is limited since the fraction of parallel work is largely I/O-bound.
Therefore, throughout this cumulative dissertation, we investigate the paradigm shift toward code-to-data, formally known as Near-Data Processing (NDP), which relieves the contention on the I/O bus by offloading processing to intelligent computational storage devices, where the data is originally located.
Firstly, we identified Native Storage Management as the essential foundation for NDP due to its direct control of physical storage management within the database. Upon this, the interface is extended to propagate address mapping information and to invoke NDP functionality on the storage device. As the former can become very large, we introduce Physical Page Pointers as one novel NDP abstraction for self-contained immutable database objects.
Secondly, the on-device navigation and interpretation of data are elaborated. Therefore, we introduce cross-layer Parsers and Accessors as another NDP abstraction that can be executed on the heterogeneous processing capabilities of modern computational storage devices. Thereby, the compute placement and resource configuration per NDP request is identified as a major performance criteria. Our experimental evaluation shows an improvement in the execution durations of 1.4x to 2.7x compared to traditional systems. Moreover, we propose a framework for the automatic generation of Parsers and Accessors on FPGAs to ease their application in NDP.
Thirdly, we investigate the interplay of NDP and modern workload characteristics like HTAP. Therefore, we present different offloading models and focus on an intervention-free execution. By propagating the Shared State with the latest modifications of the database to the computational storage device, it is able to process data with transactional guarantees. Thus, we achieve to extend the design space of HTAP with NDP by providing a solution that optimizes for performance isolation, data freshness, and the reduction of data transfers. In contrast to traditional systems, we experience no significant drop in performance when an OLAP query is invoked but a steady and 30% faster throughput.
Lastly, in-situ result-set management and consumption as well as NDP pipelines are proposed to achieve flexibility in processing data on heterogeneous hardware. As those produce final and intermediary results, we continue investigating their management and identified that an on-device materialization comes at a low cost but enables novel consumption modes and reuse semantics. Thereby, we achieve significant performance improvements of up to 400x by reusing once materialized results multiple times.
In diesem Beitrag wird ein kapazitiver Low Power DC-DC Wandler mit 15 konfigurierbaren Übersetzungsverhältnissen, einem hohen Eingangsspannungsbereich von 5 V bis 20 V und einer konstanten Ausgangsspannung von 5 V vorgestellt. Bei einer Ausgangsleistung von 5 mW wird ein maximaler Wirkungsgrad von 81% erreicht. Die Implementierung erfolgt in einem 350 nm Hochvolt-CMOS-Prozess. Während es für niedrige Eingangsspannungen eine Vielzahl an Topologien und Konzepten gibt, wurden vollintegrierte SC-Wandler für höhere Eingangsspannungen (> 8 V) bisher nur wenig untersucht. Höhere Spannungen erfordern den Einsatz von Hochvolttransistoren und eine aufwändigere Ansteuerung. Um über einen weiteren Eingangsspannungsbereicht mit hoher Genauigkeit und hohem Wirkungsgrad zu wandeln, erweist sich die Topologie des rekursiven Switched-Capacitor Wandlers (RSC Wandler) als vorteilhaft. In der vorliegenden 4-Bit Implementierung ist der RSC Wandler aus N = 4 2:1 Serien-Parallel Wandler-Zellen aufgebaut. Durch verschiedene Anordnung der einzelnen Zellen können 2ᴺ -1 = 15 Wandlungsverhältnisse realisiert werden. Mittels Rekursion werden in jedem Wandlungsverhältnis alle Kapazitäten genutzt, wodurch die Stromfähigkeit und der Wirkungsgrad des Wandlers deutlich verbessert werden. Einheitliche 2:1 Wandler-Zellen ermöglichen einen modularen Aufbau des Layouts.
Es wird ein hochintegrierter Gatetreiber für 600V-Anwendungen mit einer galvanischen Isolation zwischen der Ansteuerelektronik und der Treiberseite vorgestellt. Eine Besonderheit ist die bidirektionale Signalübertragung und die Energieversorgung über einen einzigen Transformator. Die Treiberansteuersignale werden mittels 10/20 MHz Frequenzmodulation übertragen. Die Signalrückübertragung ist in Form einer 1Mbit/s Amplitudenmodulation realisiert. Die Energieübertragung über den Transformator erlaubt ein dauerhaftes Einschalten des Treibers. Der Energiebedarf während des Schaltvorgangs wird hauptsächlich durch eine Bootstrapschaltung bereitgestellt. Eine weitere Besonderheit ist die Verwendung einer flächeneffizienten Integration einer NMOS Treiberausgangsstufe. Der Gatetreiber wurde in einer 180nm Hochvolt-BiCMOS-Technologie hergestellt. Messungen bestätigen die Funktion des Treibers.